Domov Pulpitida Vypočítejte podmíněný extrém funkce pomocí metody Lagrangeova multiplikátoru. Modelování dynamických systémů (Lagrangeova metoda a Bondův graf)

Vypočítejte podmíněný extrém funkce pomocí metody Lagrangeova multiplikátoru. Modelování dynamických systémů (Lagrangeova metoda a Bondův graf)

Dnes se v lekci naučíme najít podmiňovací způsob nebo, jak se jim také říká, relativní extrémy funkcí více proměnných a v první řadě budeme hovořit samozřejmě o podmíněných extrémech funkce dvou A tři proměnné, které se nacházejí v naprosté většině tematických problémů.

Co potřebujete vědět a umět tento moment? Navzdory skutečnosti, že tento článek je „na okraji“ tématu, k úspěšnému zvládnutí materiálu není potřeba mnoho. V tomto bodě byste si měli být vědomi toho základního povrchy prostoru, umět najít částečné derivace (alespoň na průměrné úrovni) a jak velí nemilosrdná logika, pochopit bezpodmínečné extrémy. Ale i když ty nízká úroveň příprava, nespěchejte s odjezdem - všechny chybějící znalosti/dovednosti lze skutečně „nasbírat za pochodu“ a bez hodin trápení.

Nejprve analyzujme samotný koncept a zároveň provedeme rychlé zopakování toho nejběžnějšího povrchy. Tak co to je podmíněný extrém? ...Logika zde není o nic méně nemilosrdná =) Podmíněný extrém funkce je extrémem v obvyklém slova smyslu, kterého se dosáhne při splnění určité podmínky (či podmínek).

Představte si libovolný "šikmý" letadlo PROTI Kartézský systém. Žádný extrém tady po tom není ani stopy. Ale to je prozatím. Uvažujme eliptický válec, pro jednoduchost - nekonečná kulatá „trubka“ rovnoběžná s osou. Je zřejmé, že tato „potrubí“ se „vyřízne“ z našeho letadla elipsa, v důsledku čehož bude v jejím horním bodě maximum a v dolním bodě minimum. Jinými slovy, funkce definující rovinu dosahuje extrémů vzhledem k tomuže ji křižoval daný kruhový válec. Přesně „poskytováno“! Další eliptický válec protínající tuto rovinu téměř jistě vytvoří různé minimální a maximální hodnoty.

Pokud to není příliš jasné, lze situaci realisticky simulovat (i když v obrácené pořadí) : vezměte sekeru, jděte ven a řežte... ne, Greenpeace vám to později neodpustí - je lepší odtokovou trubku rozřezat bruskou =). Podmíněné minimum a podmíněné maximum bude záviset na tom, v jaké výšce a pod čím (nehorizontální)řez je proveden pod úhlem.

Nastal čas obléknout výpočty do matematického oděvu. Uvažujme eliptický paraboloid, který má absolutní minimum v bodě . Nyní najdeme extrém vzhledem k tomu. Tento letadlo rovnoběžně s osou, což znamená, že se „vyřízne“ z paraboloidu parabola. Vrchol této paraboly bude podmíněné minimum. Navíc rovina neprochází počátkem souřadnic, takže bod zůstane irelevantní. Neposkytli jste obrázek? Pojďme okamžitě sledovat odkazy! Bude to trvat ještě mnohokrát.

Otázka: jak najít tento podmíněný extrém? Nejjednodušší způsobřešením je to z rovnice (která se nazývá - stav nebo rovnice spojení) vyjádřit např.: – a dosadit do funkce:

Výsledkem je funkce jedné proměnné, která definuje parabolu, jejíž vrchol „vypočítáte“ se zavřenýma očima. Pojďme najít kritické body:

- kritický bod.

Další nejjednodušší věc k použití je druhá postačující podmínka pro extrém:

Konkrétně: to znamená, že funkce dosáhne minima v bodě . Lze to vypočítat přímo: , ale my se vydáme akademičtější cestou. Pojďme najít souřadnici „hry“:
,

zapište si podmíněný minimální bod, ujistěte se, že skutečně leží v rovině (splňuje vazebnou rovnici):

a vypočítat podmíněné minimum funkce:
vzhledem k tomu („přísada“ je povinná!!!).

Uvažovaný způsob lze v praxi bez stínu pochybností použít, má však řadu nevýhod. Za prvé, geometrie problému není vždy jasná a za druhé je často nerentabilní vyjadřovat „x“ nebo „y“ z rovnice spojení (pokud je vůbec možné něco vyjádřit). A nyní budeme uvažovat o univerzální metodě pro nalezení podmíněných extrémů, tzv Lagrangeova multiplikační metoda:

Příklad 1

Najděte podmíněné extrémy funkce se zadanou rovnicí spojení s argumenty.

Poznáváte povrchy? ;-) ...ráda vidím tvé šťastné tváře =)

Mimochodem, z formulace tohoto problému je jasné, proč se podmínka nazývá rovnice spojení– argumenty funkce připojeno další podmínka, to znamená, že nalezené extrémní body musí nutně patřit kruhovému válci.

Řešení: v prvním kroku je potřeba uvést rovnici spojení ve tvaru a složit Lagrangeova funkce:
, kde je tzv. Lagrangeův multiplikátor.

V našem případě a:

Algoritmus pro hledání podmíněných extrémů je velmi podobný schématu pro hledání „obyčejného“ extrémy. Pojďme najít částečné derivace Lagrangeovy funkce, zatímco „lambda“ by měla být považována za konstantu:

Pojďme skládat a řešit následující systém:

Spleť je standardně rozmotaná:
z první rovnice, kterou vyjádříme ;
z druhé rovnice, kterou vyjádříme .

Dosadíme spojení do rovnice a provedeme zjednodušení:

Výsledkem jsou dva stacionární body. Pokud , pak:

pokud , tak:

Je snadné vidět, že souřadnice obou bodů splňují rovnici . Skrupulózní lidé mohou také provést úplnou kontrolu: za to musíte nahradit do první a druhé rovnice soustavy a pak totéž udělejte s množinou . Všechno se musí „sejít“.

Zkontrolujeme provedení dostatečný stav extrém pro nalezené stacionární body. Budu diskutovat o třech přístupech k řešení tohoto problému:

1) První metodou je geometrické zdůvodnění.

Pojďme vypočítat hodnoty funkce ve stacionárních bodech:

Dále si zapíšeme frázi s přibližně tímto obsahem: řez rovinou kruhovým válcem je elipsa, v jejímž horním vrcholu je dosaženo maxima a v dolním vrcholu minima. Větší hodnota je tedy podmíněné maximum a menší hodnota je podmíněné minimum.

Pokud je to možné, je lepší použít tuto metodu - je jednoduchá a učitelé toto rozhodnutí počítají (velké plus je, že jste projevili pochopení geometrický významúkoly). Jak však již bylo uvedeno, není vždy jasné, co se s čím a kde protíná, a pak přichází na pomoc analytické ověření:

2) Druhá metoda je založena na použití diferenciálních znamének druhého řádu. Pokud se ukáže, že ve stacionárním bodě, pak tam funkce dosáhne maxima, ale pokud ano, pak dosáhne minima.

Pojďme najít parciální derivace druhého řádu:

a vytvořte tento rozdíl:

Když , znamená to , že funkce dosáhne svého maxima v bodě ;
at , což znamená, že funkce dosáhne minima v bodě .

Uvažovaná metoda je velmi dobrá, má však tu nevýhodu, že v některých případech je téměř nemožné určit znaménko 2. diferenciálu (obvykle se to stane, pokud a/nebo jsou různé znaky). A pak přijde na záchranu „těžké dělostřelectvo“:

3) Rozlišme rovnici spojení „X“ a „Y“:

a složte následující symetrický matice:

Pokud je ve stacionárním bodě, pak tam funkce dosáhne ( Pozornost!) minimum, if – pak maximum.

Napišme matici pro hodnotu a odpovídající bod:

Pojďme si to spočítat determinant:
, tedy funkce má maximum v bodě .

Stejně tak pro hodnotu a bod:

Funkce má tedy minimum v bodě .

Odpovědět: vzhledem k tomu, že:

Po důkladném rozboru materiálu vám prostě nemohu pár nabídnout typické úkoly pro autotest:

Příklad 2

Najděte podmíněný extrém funkce, pokud její argumenty souvisí rovnicí

Příklad 3

Najděte extrémy funkce dané podmínkou

A opět důrazně doporučuji pochopit geometrickou podstatu úloh, zvláště v posledním příkladu, kde analytické ověření dostatečné podmínky není dar. Pamatuj si co Řádek 2. řádu nastaví rovnici a co povrch tato čára generuje v prostoru. Analyzujte, podél které křivky bude válec rovinu protínat a kde na této křivce bude minimum a kde maximum.

Řešení a odpovědi na konci lekce.

Dotyčný problém najde široké uplatnění v různých oblastech, zejména - nepůjdeme daleko, v geometrii. Vyřešme všemi oblíbený problém s půllitrovou lahví (viz příklad 7 článkuExtrémní výzvy ) druhý způsob:

Příklad 4

Jaké by měly být rozměry válcové plechovky, aby se na výrobu plechovky spotřebovalo co nejméně materiálu, pokud je objem plechovky roven

Řešení: zvažte proměnný poloměr základny, proměnnou výšku a sestavte funkci plochy celkového povrchu plechovky:
(plocha dvou krytů + boční plocha)

  • Tutorial

Každý dobrý den. V tomto článku chci ukázat jeden z grafické metody konstrukce matematické modely pro dynamické systémy, který je tzv dluhopisový graf("vazba" - spojení, "graf" - graf). V ruské literatuře jsem našel popisy této metody pouze v Tomskyho učebnici Polytechnická univerzita, A.V. Voronin „MODELOVÁNÍ MECHATRONICKÝCH SYSTÉMŮ“ 2008 Ukažte také klasická metoda prostřednictvím Lagrangeovy rovnice 2. druhu.

Lagrangeova metoda

Nebudu popisovat teorii, s pár komentáři ukážu fáze výpočtů. Osobně je pro mě snazší učit se z příkladů, než číst teorii 10x. Zdálo se mi, že v ruské literatuře je vysvětlení této metody a vlastně matematiky nebo fyziky obecně velmi bohaté složité vzorce, což vyžaduje seriózní matematický základ. Při studiu Lagrangeovy metody (studuji na Polytechnické univerzitě v Turíně v Itálii) jsem studoval ruskou literaturu pro srovnání výpočtových metod a bylo pro mě obtížné sledovat průběh řešení této metody. I při vzpomínce na modelářské kurzy v Charkovském leteckém institutu bylo odvozování takových metod velmi těžkopádné a nikdo se nesnažil tuto problematiku pochopit. Toto jsem se rozhodl napsat, manuál pro konstrukci matematických modelů podle Lagrange, jak se ukázalo, není to vůbec těžké, stačí vědět, jak počítat derivace s ohledem na čas a parciální derivace. U složitějších modelů se přidávají i rotační matice, ale ani v nich není nic složitého.

Vlastnosti metod modelování:

  • Newton-Euler: vektorové rovnice založené na dynamické rovnováze platnost A momenty
  • Lagrange: skalární rovnice založené na stavových funkcích spojených s kinetickou a potenciálovou energií
  • Bond Count: metoda založená na toku Napájení mezi prvky systému

Začněme s jednoduchý příklad. Hmota s pružinou a tlumičem. Ignorujeme gravitační sílu.


Obr. 1. Hmota s pružinou a tlumičem

V první řadě označujeme:

  • počáteční systém souřadnice(NSK) nebo pevná sk R0(i0,j0,k0). Kde? Můžete ukázat prstem na oblohu, ale škubáním špiček neuronů v mozku prochází myšlenka umístit NSC na linii pohybu těla M1.
  • souřadnicové systémy pro každé těleso s hmotou(máme M1 R1(i1,j1,k1)), orientace může být libovolná, ale proč si komplikovat život, nastavit si ji s minimálním rozdílem od NSC
  • zobecněné souřadnice Qi(minimální počet proměnných, které mohou popsat pohyb), v tomto příkladu je jedna zobecněná souřadnice, pohyb pouze podél osy j


Obr. 2. Zadali jsme souřadnicové systémy a zobecněné souřadnice


Obr. 3. Poloha a rychlost tělesa M1

Potom najdeme kinetickou (C) a potenciální (P) energii a disipativní funkci (D) pro tlumič pomocí vzorců:


Obr. 4. Kompletní vzorec Kinetická energie

V našem příkladu není žádná rotace, druhá složka je 0.




Obr. 5. Výpočet kinetické, potenciální energie a disipativní funkce

Lagrangeova rovnice má následující tvar:


Obr. 6. Lagrangeova rovnice a Lagrangeova rovnice

Delta W_i Jedná se o virtuální práci vykonávanou aplikovanými silami a momenty. Pojďme ji najít:


Obr. 7. Výpočet virtuální práce

Kde delta q_1 virtuální pohyb.

Vše dosadíme do Lagrangeovy rovnice:


Obr. 8. Výsledný hmotový model s pružinou a tlumičem

Tady Lagrangeova metoda skončila. Jak vidíte, není to tak složité, ale stále je to velmi jednoduchý příklad, pro který by s největší pravděpodobností byla Newton-Eulerova metoda ještě jednodušší. Pro složitější systémy, kde bude několik těles vůči sobě natočených pod různými úhly, bude Lagrangeova metoda jednodušší.

Metoda dluhopisového grafu

Hned vám ukážu, jak vypadá model v bond-grafu na příkladu s hmotou, pružinou a tlumičem:


Obr. 9. Bond-graph hmoty s pružinou a tlumičem

Zde budete muset říci trochu teorie, která bude stačit k sestavení jednoduché modely. Pokud má někdo zájem, může si knihu přečíst ( Metodika dluhopisového grafu) nebo ( Voronin A.V. Modelování mechatronických systémů: tutorial. – Tomsk: Nakladatelství Tomské polytechnické univerzity, 2008).

Nejprve to určíme komplexní systémy skládají z několika domén. Například elektrický motor se skládá z elektrických a mechanických částí nebo domén.

dluhopisový graf založené na výměně moci mezi těmito doménami, subsystémy. Všimněte si, že výměna energie v jakékoli formě je vždy určena dvěma proměnnými ( proměnlivý výkon) s jehož pomocí můžeme studovat interakci různých subsystémů v rámci dynamického systému (viz tabulka).

Jak je vidět z tabulky, projev síly je všude téměř stejný. Celkem, Napájení- Tato práce " tok - f"zapnuto" úsilí - e».

Úsilí(Angličtina) snaha) v elektrické oblasti je to napětí (e), v mechanické oblasti je to síla (F) nebo točivý moment (T), v hydraulice je to tlak (p).

Tok(Angličtina) tok) v elektrické oblasti je to proud (i), v mechanické oblasti je to rychlost (v) popř úhlová rychlost(omega), v hydraulice – průtok kapaliny nebo průtok (Q).

Vezmeme-li tyto zápisy, získáme výraz pro sílu:


Obr. 10. Výkonový vzorec prostřednictvím výkonových proměnných

V jazyce bond-graph je spojení mezi dvěma subsystémy, které si vyměňují moc, představováno vazbou. pouto). Proto se tato metoda nazývá dluhopisový graf nebo g raf-spojení, souvislý graf. Uvažujme blokové schéma zapojení v modelu s elektromotorem (toto ještě není bond-graf):


Obr. 11. Blokové schéma toku energie mezi doménami

Pokud máme zdroj napětí, pak podle toho generuje napětí a předává je motoru k vinutí (proto šipka směřuje k motoru), v závislosti na odporu vinutí se objevuje proud podle Ohmova zákona (směrovaný od motoru ke zdroji). Jedna proměnná je tedy vstupem do subsystému a druhá musí být výstup ze subsystému. Zde napětí ( snaha) – vstup, proud ( tok) - výstup.

Pokud použijete zdroj proudu, jak se změní diagram? Že jo. Proud bude směrován do motoru a napětí do zdroje. Poté proud ( tok) - vstupní napětí ( snaha) - výstup.

Podívejme se na příklad v mechanice. Síla působící na hmotu.


Obr. 12. Síla působící na hmotu

Blokové schéma bude následující:


Obr. 13. Blokové schéma

V tomto příkladu síla ( snaha) – vstupní proměnná pro hmotnost. (Síla působící na hmotu)
Podle druhého Newtonova zákona:

Hmotnost reaguje rychlostí:

V tomto příkladu, pokud jedna proměnná ( platnost - snaha) je vchod do mechanické domény, pak další výkonová proměnná ( Rychlost - tok) – automaticky se stane výstup.

Pro rozlišení, kde je vstup a kde výstup, se na konci šipky (spojení) mezi prvky používá svislá čára, tato čára se nazývá znamení kauzality nebo příčinná souvislost (kauzalita). Ukazuje se: aplikovaná síla je příčinou a rychlost je důsledkem. Tento znak je velmi důležitý pro správnou konstrukci modelu systému, protože kauzalita je důsledkem fyzické chování a výměna mocnin dvou subsystémů, proto volba umístění znaku kauzality nemůže být libovolná.


Obr. 14. Označení kauzality

Tato svislá čára ukazuje, na který subsystém působí síla ( snaha) a výsledkem je tok ( tok). V příkladu s hmotností by to bylo takto:


Obr. 14. Příčinný vztah pro sílu působící na hmotu

Ze šipky je zřejmé, že vstup pro hmotnost je - platnost a výstupem je Rychlost. To se děje tak, aby nedošlo k zahlcení diagramu šipkami a systematizaci konstrukce modelu.

další důležitý bod. Generalizovaný impuls(množství pohybu) a pohybující se(energetické proměnné).

Tabulka výkonových a energetických proměnných v různých oblastech



Výše uvedená tabulka představuje dvě další fyzikální veličiny používané v metodě bond-graph. Jmenují se generalizovaný impuls (R) A generalizovaný pohyb (q) nebo energetické proměnné a lze je získat integrací proměnných výkonu v čase:


Obr. 15. Vztah mezi proměnnými výkonu a energie

V elektrické doméně :

Na základě Faradayova zákona, Napětí na koncích vodiče se rovná derivaci magnetického toku tímto vodičem.


A Síla proudu - Fyzické množství, rovnající se poměru množství náboje Q procházejícího nějakým časem t průřez vodiči, na hodnotu tohoto časového úseku.

Mechanická doména:

Z druhého Newtonova zákona, Platnost– časová derivace impulsu


A odpovídajícím způsobem, Rychlost- časová derivace posunutí:

Pojďme si to shrnout:

Základní prvky

Všechny prvky v dynamických systémech lze rozdělit na dvoupólové a čtyřpólové komponenty.
Uvažujme bipolární komponenty:

Prameny
Existují zdroje jak úsilí, tak toku. Analogie v elektrické oblasti: zdroj úsilízdroj napětí, zdroj prouduaktuální zdroj. Příčinné znaky pro zdroje by měly být pouze takové.


Obr. 16. Příčinné souvislosti a označení zdrojů

Komponenta R – disipativní prvek

Složka I – setrvačný prvek

Komponenta C – kapacitní prvek

Jak je vidět z obrázků, různé prvky téhož typ R,C,I popsané stejnými rovnicemi. Rozdíl je POUZE v elektrické kapacitě, stačí si to zapamatovat!

Čtyřpólové komponenty:

Podívejme se na dvě součásti: transformátor a gyrátor.

Poslední důležitou součástí metody bond-graph jsou spoje. Existují dva typy uzlů:




S komponentami je to tak.

Hlavní kroky pro stanovení kauzálních vztahů po sestrojení dluhopisového grafu:

  1. Dejte kauzální souvislosti všem Zdroje
  2. Projděte všechny uzly a po bodu 1 uveďte příčinné vztahy
  3. Pro komponenty I přiřadit vstupní kauzální vztah (snaha je zahrnuta v této složce), pro komponenty C přiřadit výstupní kauzalitu (z této komponenty vychází úsilí)
  4. Opakujte bod 2
  5. Vložte příčinné souvislosti pro R komponenty
Tímto minikurz teorie končí. Nyní máme vše, co ke stavbě modelů potřebujeme.
Pojďme vyřešit pár příkladů. Začněme elektrickým obvodem, je lepší porozumět analogii konstrukce vazebného grafu.

Příklad 1


Začněme sestavovat bond-graf se zdrojem napětí. Stačí napsat Se a dát šipku.


Vidíte, všechno je jednoduché! Podívejme se dále, R a L jsou zapojeny do série, což znamená, že v nich teče stejný proud, pokud mluvíme ve výkonových proměnných - stejný tok. Který uzel má stejný tok? Správná odpověď je 1-uzel. Do 1-uzlu připojíme zdroj, odpor (složka - R) a indukčnost (složka - I).


Dále máme kapacitu a odpor paralelně, což znamená, že mají stejné napětí nebo sílu. 0-uzel je vhodný jako žádný jiný. K nulovému uzlu připojíme kapacitu (složka C) a odpor (složka R).


Také spojujeme uzly 1 a 0 k sobě. Směr šipek se volí libovolně, směr spojení ovlivňuje pouze znaménko v rovnicích.

Získáte následující graf připojení:

Nyní musíme navázat kauzální vztahy. Podle pokynů pro pořadí jejich umístění začneme se zdrojem.

  1. Máme zdroj napětí (úsilí), takový zdroj má pouze jednu variantu kauzality - výstup. Pojďme si to nasadit.
  2. Dále je tu komponenta I, podívejme se, co doporučují. Vložili jsme
  3. Položili jsme to pro 1-uzel. Jíst
  4. 0-uzel musí mít jeden vstupní a všechna výstupní kauzální spojení. Zatím máme jeden den volna. Hledáme komponenty C nebo I. Našli jsme to. Vložili jsme
  5. Pojďme si vyjmenovat, co zbylo


To je vše. Bond graf je vytvořen. Hurá, soudruzi!

Zbývá jen napsat rovnice, které popisují naši soustavu. Chcete-li to provést, vytvořte tabulku se 3 sloupci. První bude obsahovat všechny komponenty systému, druhý bude obsahovat vstupní proměnnou pro každý prvek a třetí bude obsahovat výstupní proměnnou pro stejnou komponentu. Vstup a výstup jsme již definovali pomocí kauzálních vztahů. Takže by neměly být žádné problémy.

Pro snadnější zaznamenávání úrovní očíslujme každé připojení. Rovnice pro každý prvek vezmeme ze seznamu složek C, R, I.



Po sestavení tabulky definujeme stavové proměnné, v tomto příkladu jsou 2, p3 a q5. Dále si musíte zapsat stavové rovnice:


To je vše, model je připraven.

Příklad 2. Hned bych se chtěl omluvit za kvalitu fotky, hlavní je, že umíte číst

Vyřešme další příklad pro mechanický systém, stejný, který jsme řešili pomocí Lagrangeovy metody. Řešení ukážu bez komentáře. Podívejme se, která z těchto metod je jednodušší a jednodušší.

V Matbale byly sestaveny oba matematické modely se stejnými parametry, získané Lagrangeovou metodou a bond-graph. Výsledek je níže: Přidejte značky

Nejprve se podívejme na případ funkce dvou proměnných. Podmíněný extrém funkce $z=f(x,y)$ v bodě $M_0(x_0;y_0)$ je extrém této funkce dosažený za podmínky, že proměnné $x$ a $y$ v okolí tohoto bodu splňuje rovnici spojení $\ varphi (x,y)=0$.

Název „podmíněný“ extrém je způsoben tím, že proměnné podléhají dodatečná podmínka$\varphi(x,y)=0$. Pokud lze jednu proměnnou vyjádřit ze spojovací rovnice přes druhou, pak se problém určení podmíněného extrému redukuje na problém určení obvyklého extrému funkce jedné proměnné. Pokud například rovnice spojení implikuje $y=\psi(x)$, pak dosazením $y=\psi(x)$ do $z=f(x,y)$ získáme funkci jedné proměnné $z =f\left (x,\psi(x)\right)$. V obecný případ Tato metoda je však málo použitelná, takže je nutné zavést nový algoritmus.

Lagrangeova multiplikační metoda pro funkce dvou proměnných.

Metoda Lagrangeova multiplikátoru spočívá v konstrukci Lagrangeovy funkce pro nalezení podmíněného extrému: $F(x,y)=f(x,y)+\lambda\varphi(x,y)$ (parametr $\lambda$ se nazývá Lagrangeův multiplikátor). Potřebné podmínky pro extrém jsou specifikovány soustavou rovnic, ze kterých jsou určeny stacionární body:

$$ \left \( \begin(zarovnáno) & \frac(\částečné F)(\částečné x)=0;\\ & \frac(\částečné F)(\částečné y)=0;\\ & \varphi (x,y)=0. \end(zarovnáno) \vpravo. $$

Postačující podmínkou, ze které lze určit povahu extrému, je znaménko $d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy) ^("" )dy^2$. Pokud je ve stacionárním bodě $d^2F > 0$, pak má funkce $z=f(x,y)$ v tomto bodě podmíněné minimum, ale pokud $d^2F< 0$, то условный максимум.

Existuje další způsob, jak určit povahu extrému. Z vazebné rovnice získáme: $\varphi_(x)^(")dx+\varphi_(y)^(")dy=0$, $dy=-\frac(\varphi_(x)^("))( \varphi_ (y)^("))dx$, proto v jakémkoli stacionárním bodě máme:

$$d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=F_(xx)^( "")dx^2+2F_(xy)^("")dx\left(-\frac(\varphi_(x)^("))(\varphi_(y)^("))dx\right)+ F_(yy)^("")\left(-\frac(\varphi_(x)^("))(\varphi_(y)^("))dx\right)^2=\\ =-\frac (dx^2)(\left(\varphi_(y)^(") \right)^2)\cdot\left(-(\varphi_(y)^("))^2 F_(xx)^(" ")+2\varphi_(x)^(")\varphi_(y)^(")F_(xy)^("")-(\varphi_(x)^("))^2 F_(yy)^ ("") \vpravo)$$

Druhý faktor (umístěný v závorkách) může být znázorněn v této podobě:

Prvky determinantu $\left| jsou zvýrazněny červeně. \begin(array) (cc) F_(xx)^("") & F_(xy)^("") \\ F_(xy)^("") & F_(yy)^("") \end (pole)\right|$, což je hessián Lagrangeovy funkce. Pokud $H > 0$, pak $d^2F< 0$, что указывает на условный максимум. Аналогично, при $H < 0$ имеем $d^2F >0 $, tj. máme podmíněné minimum funkce $z=f(x,y)$.

Poznámka k zápisu determinantu $H$. zobrazit\skrýt

$$ H=-\left|\begin(pole) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_ (xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \ end(pole) \right| $$

V této situaci se výše formulované pravidlo změní následovně: pokud $H > 0$, pak má funkce podmíněné minimum, a pokud $H< 0$ получим условный максимум функции $z=f(x,y)$. При решении задач следует учитывать такие нюансы.

Algoritmus pro studium funkce dvou proměnných pro podmíněný extrém

  1. Sestavte Lagrangeovu funkci $F(x,y)=f(x,y)+\lambda\varphi(x,y)$
  2. Vyřešte systém $ \left \( \begin(zarovnáno) & \frac(\částečné F)(\částečné x)=0;\\ & \frac(\částečné F)(\částečné y)=0;\\ & \ varphi (x,y)=0. \end(zarovnáno) \vpravo.$
  3. Určete povahu extrému v každém ze stacionárních bodů nalezených v předchozím odstavci. Chcete-li to provést, použijte některou z následujících metod:
    • Sestavte determinant $H$ a zjistěte jeho znaménko
    • S přihlédnutím ke spojovací rovnici vypočítejte znaménko $d^2F$

Metoda Lagrangeova multiplikátoru pro funkce n proměnných

Řekněme, že máme funkci $n$ proměnných $z=f(x_1,x_2,\ldots,x_n)$ a $m$ spojovacích rovnic ($n > m$):

$$\varphi_1(x_1,x_2,\ldots,x_n)=0; \; \varphi_2(x_1,x_2,\ldots,x_n)=0,\ldots,\varphi_m(x_1,x_2,\ldots,x_n)=0,$$

Označením Lagrangeových multiplikátorů jako $\lambda_1,\lambda_2,\ldots,\lambda_m$ vytvoříme Lagrangeovu funkci:

$$F(x_1,x_2,\ldots,x_n,\lambda_1,\lambda_2,\ldots,\lambda_m)=f+\lambda_1\varphi_1+\lambda_2\varphi_2+\ldots+\lambda_m\varphi_m$$

Nezbytné podmínky pro přítomnost podmíněného extrému jsou dány systémem rovnic, ze kterých se nacházejí souřadnice stacionárních bodů a hodnoty Lagrangeových multiplikátorů:

$$\left\(\begin(zarovnáno) & \frac(\částečné F)(\částečné x_i)=0; (i=\overline(1,n))\\ & \varphi_j=0; (j=\ overline(1,m)) \end(zarovnáno) \right.$$

Zda má funkce v nalezeném bodě podmíněné minimum nebo podmíněné maximum, můžete jako dříve zjistit pomocí znaménka $d^2F$. Pokud je v nalezeném bodě $d^2F > 0$, pak má funkce podmíněné minimum, ale pokud $d^2F< 0$, - то условный максимум. Можно пойти иным путем, рассмотрев следующую матрицу:

Determinant matice $\left| \begin(pole) (ccccc) \frac(\částečné^2F)(\částečné x_(1)^(2)) & \frac(\částečné^2F)(\částečné x_(1)\částečné x_(2) ) & \frac(\částečné^2F)(\částečné x_(1)\částečné x_(3)) &\ldots & \frac(\částečné^2F)(\částečné x_(1)\částečné x_(n)) \\ \frac(\částečné^2F)(\částečné x_(2)\částečné x_1) & \frac(\částečné^2F)(\částečné x_(2)^(2)) & \frac(\částečné^2F )(\částečné x_(2)\částečné x_(3)) &\ldots & \frac(\částečné^2F)(\částečné x_(2)\částečné x_(n))\\ \frac(\částečné^2F )(\částečné x_(3) \částečné x_(1)) & \frac(\částečné^2F)(\částečné x_(3)\částečné x_(2)) & \frac(\částečné^2F)(\částečné x_(3)^(2)) &\ldots & \frac(\partial^2F)(\částečné x_(3)\částečné x_(n))\\ \ldots & \ldots & \ldots &\ldots & \ ldots\\ \frac(\částečné^2F)(\částečné x_(n)\částečné x_(1)) & \frac(\částečné^2F)(\částečné x_(n)\částečné x_(2)) & \ frac(\částečné^2F)(\částečné x_(n)\částečné x_(3)) &\ldots & \frac(\částečné^2F)(\částečné x_(n)^(2))\\ \end( pole) \right|$, zvýrazněné červeně v matici $L$, je Hessián Lagrangeovy funkce. Používáme následující pravidlo:

  • Jsou-li znaky úhlových nezletilých $H_(2m+1),\; H_(2m+2),\ldots,H_(m+n)$ matice $L$ se shodují se znaménkem $(-1)^m$, pak studovaný stacionární bod je podmíněným minimálním bodem funkce $ z=f(x_1,x_2,x_3,\ldots,x_n)$.
  • Jsou-li znaky úhlových nezletilých $H_(2m+1),\; H_(2m+2),\ldots,H_(m+n)$ se střídají a znaménko vedlejšího $H_(2m+1)$ se shoduje se znaménkem čísla $(-1)^(m+1 )$, pak stacionární bod je podmíněným maximálním bodem funkce $z=f(x_1,x_2,x_3,\ldots,x_n)$.

Příklad č. 1

Najděte podmíněný extrém funkce $z(x,y)=x+3y$ pod podmínkou $x^2+y^2=10$.

Geometrický výklad tohoto problému je následující: musíte najít největší a nejmenší hodnotu aplikace roviny $z=x+3y$ pro body jejího průsečíku s válcem $x^2+y^2=10$.

Vyjádřit jednu proměnnou přes druhou z vazebné rovnice a dosadit ji do funkce $z(x,y)=x+3y$ je poněkud obtížné, proto použijeme Lagrangeovu metodu.

Označením $\varphi(x,y)=x^2+y^2-10$ vytvoříme Lagrangeovu funkci:

$$ F(x,y)=z(x,y)+\lambda \varphi(x,y)=x+3y+\lambda(x^2+y^2-10);\\ \frac(\částečné F)(\částečné x)=1+2\lambda x; \frac(\částečné F)(\částečné y)=3+2\lambda y. $$

Napišme soustavu rovnic pro určení stacionárních bodů Lagrangeovy funkce:

$$ \left \( \začátek(zarovnáno) & 1+2\lambda x=0;\\ & 3+2\lambda y=0;\\ & x^2+y^2-10=0. \end (zarovnáno)\vpravo.$$

Pokud předpokládáme $\lambda=0$, pak první rovnice bude: $1=0$. Výsledný rozpor ukazuje, že $\lambda\neq 0$. Za podmínky $\lambda\neq 0$ z první a druhé rovnice máme: $x=-\frac(1)(2\lambda)$, $y=-\frac(3)(2\lambda) $. Dosazením získaných hodnot do třetí rovnice dostaneme:

$$ \left(-\frac(1)(2\lambda) \right)^2+\left(-\frac(3)(2\lambda) \right)^2-10=0;\\ \frac (1)(4\lambda^2)+\frac(9)(4\lambda^2)=10; \lambda^2=\frac(1)(4); \left[ \begin(zarovnáno) & \lambda_1=-\frac(1)(2);\\ & \lambda_2=\frac(1)(2). \end(zarovnáno) \vpravo.\\ \begin(zarovnáno) & \lambda_1=-\frac(1)(2); \; x_1=-\frac(1)(2\lambda_1)=1; \; y_1=-\frac(3)(2\lambda_1)=3;\\ & \lambda_2=\frac(1)(2); \; x_2=-\frac(1)(2\lambda_2)=-1; \; y_2=-\frac(3)(2\lambda_2)=-3.\end(zarovnáno) $$

Systém má tedy dvě řešení: $x_1=1;\; y_1=3;\; \lambda_1=-\frac(1)(2)$ a $x_2=-1;\; y_2=-3;\; \lambda_2=\frac(1)(2)$. Zjistěme povahu extrému v každém stacionárním bodě: $M_1(1;3)$ a $M_2(-1;-3)$. Za tímto účelem vypočítáme determinant $H$ v každém bodě.

$$ \varphi_(x)^(")=2x;\; \varphi_(y)^(")=2y;\; F_(xx)^("")=2\lambda;\; F_(xy)^("")=0;\; F_(yy)^("")=2\lambda.\\ H=\left| \begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_(xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \end(pole) \right|= \left| \begin(pole) (ccc) 0 & 2x & 2y\\ 2x & 2\lambda & 0 \\ 2y & 0 & 2\lambda \end(pole) \right|= 8\cdot\left| \begin(pole) (ccc) 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end(pole) \right| $$

V bodě $M_1(1;3)$ dostáváme: $H=8\cdot\left| \begin(pole) (ccc) 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end(pole) \right|= 8\cdot\left| \begin(pole) (ccc) 0 & 1 & 3\\ 1 & -1/2 & 0 \\ 3 & 0 & -1/2 \end(pole) \right|=40 > 0$, takže na bod Funkce $M_1(1;3)$ $z(x,y)=x+3y$ má podmíněné maximum, $z_(\max)=z(1;3)=10$.

Podobně v bodě $M_2(-1,-3)$ najdeme: $H=8\cdot\left| \begin(pole) (ccc) 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end(pole) \right|= 8\cdot\left| \begin(pole) (ccc) 0 & -1 & -3\\ -1 & 1/2 & 0 \\ -3 & 0 & 1/2 \end(pole) \right|=-40$. Od $ H< 0$, то в точке $M_2(-1;-3)$ имеем условный минимум функции $z(x,y)=x+3y$, а именно: $z_{\min}=z(-1;-3)=-10$.

Podotýkám, že místo výpočtu hodnoty determinantu $H$ v každém bodě je mnohem pohodlnější jej rozšířit v obecný pohled. Aby nebyl text zahlcen detaily, schovám tento způsob pod poznámku.

Zápis determinantu $H$ v obecném tvaru. zobrazit\skrýt

$$ H=8\cdot\left|\begin(pole)(ccc)0&x&y\\x&\lambda&0\\y&0&\lambda\end(pole)\right| =8\cdot\left(-\lambda(y^2)-\lambda(x^2)\vpravo) =-8\lambda\cdot\left(y^2+x^2\vpravo). $$

V zásadě je již zřejmé, jaké znaménko $H$ má. Protože žádný z bodů $M_1$ nebo $M_2$ se neshoduje s počátkem, pak $y^2+x^2>0$. Znaménko $H$ je tedy opačné než znaménko $\lambda$. Výpočty můžete dokončit:

$$ \začátek(zarovnáno) &H(M_1)=-8\cdot\left(-\frac(1)(2)\right)\cdot\left(3^2+1^2\right)=40;\ \ &H(M_2)=-8\cdot\frac(1)(2)\cdot\left((-3)^2+(-1)^2\vpravo)=-40. \end(zarovnáno) $$

Otázku po povaze extrému ve stacionárních bodech $M_1(1;3)$ a $M_2(-1;-3)$ lze vyřešit bez použití determinantu $H$. Najdeme znaménko $d^2F$ v každém stacionárním bodě:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=2\lambda \left( dx^2+dy^2\vpravo) $$

Upozorňuji, že zápis $dx^2$ znamená přesně $dx$ umocněný na druhou mocninu, tzn. $\left(dx \right)^2$. Máme tedy: $dx^2+dy^2>0$, tedy s $\lambda_1=-\frac(1)(2)$ dostaneme $d^2F< 0$. Следовательно, функция имеет в точке $M_1(1;3)$ условный максимум. Аналогично, в точке $M_2(-1;-3)$ получим условный минимум функции $z(x,y)=x+3y$. Отметим, что для определения знака $d^2F$ не пришлось учитывать связь между $dx$ и $dy$, ибо знак $d^2F$ очевиден без дополнительных преобразований. В следующем примере для определения знака $d^2F$ уже будет необходимо учесть связь между $dx$ и $dy$.

Odpovědět: v bodě $(-1;-3)$ má funkce podmíněné minimum, $z_(\min)=-10$. V bodě $(1;3)$ má funkce podmíněné maximum, $z_(\max)=10$

Příklad č. 2

Najděte podmíněný extrém funkce $z(x,y)=3y^3+4x^2-xy$ pod podmínkou $x+y=0$.

První metoda (metoda Lagrangeova multiplikátoru)

Označením $\varphi(x,y)=x+y$ složíme Lagrangeovu funkci: $F(x,y)=z(x,y)+\lambda \varphi(x,y)=3y^3+ 4x^2 -xy+\lambda(x+y)$.

$$ \frac(\částečné F)(\částečné x)=8x-y+\lambda; \; \frac(\částečné F)(\částečné y)=9y^2-x+\lambda.\\ \left \( \begin(zarovnáno) & 8x-y+\lambda=0;\\ & 9y^2-x+\ lambda=0; \\ & x+y=0. \end(zarovnáno) \vpravo. $$

Po vyřešení systému dostaneme: $x_1=0$, $y_1=0$, $\lambda_1=0$ a $x_2=\frac(10)(9)$, $y_2=-\frac(10)( 9) $, $\lambda_2=-10 $. Máme dva stacionární body: $M_1(0;0)$ a $M_2 \left(\frac(10)(9);-\frac(10)(9) \right)$. Zjistime povahu extrému v každém stacionárním bodě pomocí determinantu $H$.

$$H=\left| \begin(array) (ccc) 0 & \varphi_(x)^(") & \varphi_(y)^(")\\ \varphi_(x)^(") & F_(xx)^("") & F_(xy)^("") \\ \varphi_(y)^(") & F_(xy)^("") & F_(yy)^("") \end(pole) \right|= \left| \begin(pole) (ccc) 0 & 1 & 1\\ 1 & 8 & -1 \\ 1 & -1 & 18y \end(pole) \right|=-10-18y $$

V bodě $M_1(0;0)$ $H=-10-18\cdot 0=-10< 0$, поэтому $M_1(0;0)$ есть точка условного минимума функции $z(x,y)=3y^3+4x^2-xy$, $z_{\min}=0$. В точке $M_2\left(\frac{10}{9};-\frac{10}{9}\right)$ $H=10 >0$, proto má v tomto bodě funkce podmíněné maximum, $z_(\max)=\frac(500)(243)$.

Zkoumáme povahu extrému v každém bodě pomocí jiné metody na základě znaménka $d^2F$:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=8dx^2-2dxdy+ 18ydy ^2 $$

Z rovnice spojení $x+y=0$ máme: $d(x+y)=0$, $dx+dy=0$, $dy=-dx$.

$$ d^2 F=8dx^2-2dxdy+18ydy^2=8dx^2-2dx(-dx)+18y(-dx)^2=(10+18y)dx^2 $$

Protože $ d^2F \Bigr|_(M_1)=10 dx^2 > 0$, pak $M_1(0;0)$ je podmíněný minimální bod funkce $z(x,y)=3y^3+ 4x^ 2-xy$. Podobně $d^2F \Bigr|_(M_2)=-10 dx^2< 0$, т.е. $M_2\left(\frac{10}{9}; -\frac{10}{9} \right)$ - точка условного максимума.

Druhý způsob

Z rovnice připojení $x+y=0$ dostaneme: $y=-x$. Dosazením $y=-x$ do funkce $z(x,y)=3y^3+4x^2-xy$ získáme nějakou funkci proměnné $x$. Označme tuto funkci jako $u(x)$:

$$ u(x)=z(x,-x)=3\cdot(-x)^3+4x^2-x\cdot(-x)=-3x^3+5x^2. $$

Redukovali jsme tedy problém hledání podmíněného extrému funkce dvou proměnných na problém určení extrému funkce jedné proměnné.

$$ u_(x)^(")=-9x^2+10x;\\ -9x^2+10x=0; \; x\cdot(-9x+10)=0;\\ x_1=0; \ ; y_1=-x_1=0;\\ x_2=\frac(10)(9);\; y_2=-x_2=-\frac(10)(9). $$

Získali jsme body $M_1(0;0)$ a $M_2\left(\frac(10)(9); -\frac(10)(9)\right)$. Další výzkum je znám z průběhu diferenciálního počtu funkcí jedné proměnné. Zkoumáním znaménka $u_(xx)^("")$ v každém stacionárním bodě nebo kontrolou změny znaménka $u_(x)^(")$ v nalezených bodech získáme stejné závěry, jako když řešení první metody. Například zkontrolujeme znaménko $u_(xx)^("")$:

$$u_(xx)^("")=-18x+10;\\ u_(xx)^("")(M_1)=10;\;u_(xx)^("")(M_2)=- 10, $ $

Protože $u_(xx)^("")(M_1)>0$, potom $M_1$ je minimální bod funkce $u(x)$ a $u_(\min)=u(0)=0 $ . Od $u_(xx)^("")(M_2)<0$, то $M_2$ - точка максимума функции $u(x)$, причём $u_{\max}=u\left(\frac{10}{9}\right)=\frac{500}{243}$.

Hodnoty funkce $u(x)$ pro danou podmínku připojení se shodují s hodnotami funkce $z(x,y)$, tzn. nalezené extrémy funkce $u(x)$ jsou hledané podmíněné extrémy funkce $z(x,y)$.

Odpovědět: v bodě $(0;0)$ má funkce podmíněné minimum, $z_(\min)=0$. V bodě $\left(\frac(10)(9); -\frac(10)(9) \right)$ má funkce podmíněné maximum, $z_(\max)=\frac(500)(243 )$.

Uvažujme další příklad, ve kterém objasníme povahu extrému určením znaménka $d^2F$.

Příklad č. 3

Najděte největší a nejmenší hodnotu funkce $z=5xy-4$, pokud jsou proměnné $x$ a $y$ kladné a splňují spojovací rovnici $\frac(x^2)(8)+\frac( y^2)(2) -1=0$.

Složme Lagrangeovu funkci: $F=5xy-4+\lambda \left(\frac(x^2)(8)+\frac(y^2)(2)-1 \right)$. Pojďme najít stacionární body Lagrangeovy funkce:

$$ F_(x)^(")=5y+\frac(\lambda x)(4); \; F_(y)^(")=5x+\lambda y.\\ \left \( \begin(zarovnáno) & 5y+\frac(\lambda x)(4)=0;\\ & 5x+\lambda y=0;\\ & \frac(x^2)(8)+\frac(y^2)(2)- 1=0;\\ & x > 0; \;y > 0. \end(zarovnáno) \vpravo. $$

Všechny další transformace se provádějí s přihlédnutím k $x > 0; \; y > 0 $ (toto je uvedeno v prohlášení o problému). Z druhé rovnice vyjádříme $\lambda=-\frac(5x)(y)$ a nalezenou hodnotu dosadíme do první rovnice: $5y-\frac(5x)(y)\cdot \frac(x)(4 )=0$, $4y^2-x^2=0$, $x=2y$. Dosazením $x=2y$ do třetí rovnice dostaneme: $\frac(4y^2)(8)+\frac(y^2)(2)-1=0$, $y^2=1$, $y = 1 $.

Protože $y=1$, pak $x=2$, $\lambda=-10$. Povahu extrému v bodě $(2;1)$ určíme na základě znaménka $d^2F$.

$$ F_(xx)^("")=\frac(\lambda)(4); \; F_(xy)^("")=5; \; F_(yy)^("")=\lambda. $$

Protože $\frac(x^2)(8)+\frac(y^2)(2)-1=0$, pak:

$$ d\left(\frac(x^2)(8)+\frac(y^2)(2)-1\right)=0; \; d\left(\frac(x^2)(8) \right)+d\left(\frac(y^2)(2) \right)=0; \; \frac(x)(4)dx+ydy=0; \; dy=-\frac(xdx)(4y). $$

V zásadě zde můžete okamžitě dosadit souřadnice stacionárního bodu $x=2$, $y=1$ a parametr $\lambda=-10$, čímž získáte:

$$ F_(xx)^("")=\frac(-5)(2); \; F_(xy)^("")=-10; \; dy=-\frac(dx)(2).\\ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^(" ")dy^2=-\frac(5)(2)dx^2+10dx\cdot \left(-\frac(dx)(2) \right)-10\cdot \left(-\frac(dx) (2) \vpravo)^2=\\ =-\frac(5)(2)dx^2-5dx^2-\frac(5)(2)dx^2=-10dx^2. $$

V jiných problémech na podmíněném extrému však může být několik stacionárních bodů. V takových případech je lepší reprezentovat $d^2F$ v obecném tvaru a poté dosadit souřadnice každého z nalezených stacionárních bodů do výsledného výrazu:

$$ d^2 F=F_(xx)^("")dx^2+2F_(xy)^("")dxdy+F_(yy)^("")dy^2=\frac(\lambda) (4)dx^2+10\cdot dx\cdot \frac(-xdx)(4y) +\lambda\cdot \left(-\frac(xdx)(4y) \right)^2=\\ =\frac (\lambda)(4)dx^2-\frac(5x)(2y)dx^2+\lambda \cdot \frac(x^2dx^2)(16y^2)=\left(\frac(\lambda )(4)-\frac(5x)(2y)+\frac(\lambda \cdot x^2)(16y^2) \right)\cdot dx^2 $$

Dosazením $x=2$, $y=1$, $\lambda=-10$ dostaneme:

$$ d^2 F=\left(\frac(-10)(4)-\frac(10)(2)-\frac(10 \cdot 4)(16) \right)\cdot dx^2=- 10dx^2. $$

Protože $d^2F=-10\cdot dx^2< 0$, то точка $(2;1)$ есть точкой условного максимума функции $z=5xy-4$, причём $z_{\max}=10-4=6$.

Odpovědět: v bodě $(2;1)$ má funkce podmíněné maximum, $z_(\max)=6$.

V další části se budeme zabývat aplikací Lagrangeovy metody pro funkce většího počtu proměnných.

Lagrangeova multiplikační metoda.

Metoda Lagrangeova multiplikátoru je jednou z metod, která umožňuje řešit problémy bez lineární programování.

Nelineární programování je odvětví matematického programování, které studuje metody řešení extrémních problémů s nelineární účelovou funkcí a oblastí proveditelných řešení definovaných nelineárními omezeními. V ekonomii to odpovídá skutečnosti, že výsledky (efektivita) rostou nebo klesají neúměrně ke změnám v rozsahu využití zdrojů (nebo, co je stejné, v rozsahu výroby): například v důsledku rozdělení výrobních nákladů v podniky na variabilní a polofixní; z důvodu nasycení poptávky po zboží, kdy každá následující jednotka je obtížněji prodejná než ta předchozí atd.

Problém nelineárního programování je položen jako problém nalezení optima určitého Objektivní funkce

F(x 1 ,…x n), F (X) → max

když jsou splněny podmínky

g j (x 1 ,…x n)≥0, G (X) ≤ b , X ≥ 0

Kde X-vektor požadovaných proměnných;

F (X) -Objektivní funkce;

G (X) - omezující funkce (průběžně diferencovatelná);

b - vektor omezujících konstant.

Řešení problému nelineárního programování (globální maximum nebo minimum) může patřit buď na hranici, nebo do nitra přípustné množiny.

Na rozdíl od problému lineárního programování v problému nelineárního programování nemusí optimum nutně ležet na hranici oblasti definované omezeními. Jinými slovy, úkolem je vybrat takové nezáporné hodnoty proměnných, podléhající systému omezení ve formě nerovností, pod kterými je dosaženo maxima (nebo minima) dané funkce. V tomto případě nejsou specifikovány tvary ani účelové funkce, ani nerovnic. Může být různé případy: účelová funkce je nelineární a omezení jsou lineární; účelová funkce je lineární a omezení (alespoň jedno z nich) jsou nelineární; jak účelová funkce, tak omezení jsou nelineární.

Problém nelineárního programování se nachází v přírodních vědách, technice, ekonomii, matematice a v oblasti obchodní vztahy a ve vědě o vládě.



Nelineární programování například souvisí se základním ekonomickým problémem. V problému alokace omezených zdrojů se tedy maximalizuje buď účinnost, nebo, pokud je spotřebitel studován, spotřeba za přítomnosti omezení, která vyjadřují podmínky nedostatku zdrojů. V takto obecné formulaci může být matematická formulace problému nemožná, ale ve specifických aplikacích lze kvantitativní formu všech funkcí určit přímo. Například, průmyslový podnik vyrábí plastové výrobky. Efektivita výroby se zde měří ziskem a omezení jsou interpretována jako hotovost pracovní síla, výrobní oblasti, výkon zařízení atd.

Metoda nákladové efektivity také zapadá do schématu nelineárního programování. Tato metoda byl vyvinut pro použití při rozhodování ve vládě. Společnou funkcí efektivity je blahobyt. Zde vyvstávají dva problémy nelineárního programování: prvním je maximalizace efektu při omezených nákladech, druhým je minimalizace nákladů za předpokladu, že efekt je nad určitou minimální úrovní. Tento problém je obvykle dobře modelován pomocí nelineárního programování.

Výsledky řešení problému nelineárního programování jsou užitečné při rozhodování vlády. Výsledné řešení je samozřejmě doporučeno, proto je nutné před konečným rozhodnutím prozkoumat předpoklady a přesnost problému nelineárního programování.

Nelineární problémy jsou složité, často se zjednodušují tím, že vedou k lineárním. K tomu se běžně předpokládá, že v určité oblasti se účelová funkce zvyšuje nebo snižuje úměrně změně nezávislých proměnných. Tento přístup se nazývá metoda po částech lineárních aproximací, je však použitelný pouze pro určité typy nelineárních problémů.

Nelineární problémy za určitých podmínek se řeší pomocí Lagrangeovy funkce: nalezením jejího sedlového bodu se tím najde řešení problému. Mezi výpočetní algoritmy N. p. skvělé místo okupovat gradientní metody. Neexistuje žádná univerzální metoda pro nelineární problémy a zjevně ani nemusí existovat, protože jsou extrémně rozmanité. Multiextrémní problémy se řeší obzvláště obtížně.

Jednou z metod, která umožňuje redukovat problém nelineárního programování na řešení soustavy rovnic, je Lagrangeova metoda neurčitých multiplikátorů.

Pomocí Lagrangeovy multiplikační metody v podstatě stanovíme potřebné podmínky, umožňující identifikovat optimální body v optimalizačních problémech s omezeními ve formě rovností. V tomto případě se problém s omezeními transformuje na ekvivalentní problém bezpodmínečná optimalizace, který zahrnuje některé neznámé parametry zvané Lagrangeovy multiplikátory.

Metoda Lagrangeova multiplikátoru spočívá v redukci problémů na podmíněném extrému na problémy na nepodmíněném extrému pomocné funkce - tzv. Lagrangeovy funkce.

Pro problém extrému funkce F(x 1, x 2,..., x n) za podmínek (omezující rovnice) φ i(x 1, x 2, ..., x n) = 0, i= 1, 2,..., m, Lagrangeova funkce má tvar

L(x 1, x 2… x n,λ 1, λ 2,…λm)=f(x 1, x 2… x n)+∑ i -1 m λ i φ i (x 1, x 2… x n)

Multiplikátory λ 1, λ 2, ..., λm volal Lagrangeovy multiplikátory.

Pokud hodnoty x 1 , x 2 , ..., x n , λ 1 , λ 2 , ..., λm podstatou řešení rovnic, které určují stacionární body Lagrangeovy funkce, totiž pro diferencovatelné funkce jsou řešení soustavy rovnic

pak, za docela obecných předpokladů, x 1 , x 2 , ..., x n poskytují extrém funkce f.

Zvažte problém minimalizace funkce n proměnných s jedním omezením ve formě rovnosti:

Minimalizovat f(x 1, x 2… x n) (1)

za omezení h 1 (x 1, x 2… x n)=0 (2)

Podle Lagrangeovy multiplikační metody se tento problém transformuje na následující neomezený optimalizační problém:

minimalizovat L(x,λ)=f(x)-λ*h(x) (3)

kde se funkce L(x;λ) nazývá Lagrangeova funkce,

λ je neznámá konstanta, která se nazývá Lagrangeův multiplikátor. Na znaménko λ nejsou žádné požadavky.

Nechť pro danou hodnotu λ=λ 0 je v bodě x=x 0 dosaženo nepodmíněné minimum funkce L(x,λ) vzhledem k x a x 0 splňuje rovnici h 1 (x 0)=0 . Pak, jak je snadné vidět, x 0 minimalizuje (1) s přihlédnutím k (2), protože pro všechny hodnoty x vyhovující (2), h 1 (x)=0 a L(x,λ)=min f(x).

Samozřejmě je nutné zvolit hodnotu λ=λ 0 tak, aby souřadnice nepodmíněného minimálního bodu x 0 vyhovovala rovnosti (2). To lze provést, pokud vezmeme v úvahu λ jako proměnnou, najdeme nepodmíněné minimum funkce (3) ve tvaru funkce λ a poté zvolíme hodnotu λ, při které je splněna rovnost (2). Ukažme si to na konkrétním příkladu.

Minimalizujte f(x)=x 1 2 +x 2 2 =0

pod omezením h 1 (x)=2x 1 +x 2 -2=0=0

Odpovídající neomezený optimalizační problém je zapsán následovně:

minimalizovat L(x,λ)=x 1 2 +x 2 2 -λ(2x 1 +x 2 -2)

Řešení. Když vyrovnáme dvě složky gradientu L k nule, dostaneme

→ x 10 =λ

→ x 20 =λ/2

Abychom ověřili, zda stacionární bod x° odpovídá minimu, vypočítáme prvky Hessovy matice funkce L(x;u), uvažovanou jako funkci x,

což se ukazuje jako pozitivně definitivní.

To znamená, že L(x,u) je konvexní funkce x. V důsledku toho souřadnice x 1 0 =λ, x 2 0 =λ/2 určují bod globálního minima. Optimální hodnotaλ se zjistí dosazením hodnot x 1 0 a x 2 0 do rovnice 2x 1 + x 2 =2, z čehož 2λ+λ/2=2 nebo λ 0 =4/5. Podmíněné minimum je tedy dosaženo při x 1 0 = 4/5 a x 2 0 = 2/5 a je rovno min f(x) = 4/5.

Při řešení příkladové úlohy jsme uvažovali L(x;λ) jako funkci dvou proměnných x 1 a x 2 a navíc předpokládali, že hodnota parametru λ byla zvolena tak, aby byla splněna podmínka. Pokud řešení systému

J=1,2,3,…,n

λ nelze získat ve formě explicitních funkcí, pak hodnoty x a λ zjistíme řešením následujícího systému sestávajícího z n+1 rovnic s n+1 neznámými:

J=1,2,3,…,n., h 1 (x)=0

Najít všechny možné řešení Tento systém může používat numerické metody vyhledávání (například Newtonova metoda). Pro každé z řešení () bychom měli vypočítat prvky Hessovy matice funkce L, uvažované jako funkce x, a zjistit, zda je tato matice kladně definitní (lokální minimum) nebo záporně definitní (lokální maximum). ).

Metodu Lagrangeova multiplikátoru lze rozšířit na případ, kdy má problém několik omezení ve formě rovnosti. Zvažte obecný problém, který vyžaduje

Minimalizovat f(x)

za omezení h k = 0, k = 1, 2, ..., K.

Lagrangeova funkce má následující podobu:

Tady λi, λ2, ..., λk-Lagrangeovy multiplikátory, tzn. neznámé parametry, jejichž hodnoty je třeba určit. Když parciální derivace L vzhledem k x dáme rovnítko nule, dostaneme následující systém n rovnic s n neznámými:

Pokud se ukáže, že je obtížné najít řešení výše uvedeného systému ve formě funkcí vektoru λ, můžete systém rozšířit zahrnutím omezení ve formě rovnosti

Řešení rozšířené soustavy, sestávající z n + K rovnic s n + K neznámými, určuje stacionární bod funkce L. Poté je implementován postup kontroly minima nebo maxima, který se provádí na základě výpočtu prvky Hessovy matice funkce L, uvažované jako funkce x, podobně jako v případě problému s jedním omezením. Pro některé problémy nemusí mít rozšířený systém n+K rovnic s n+K neznámými řešení a metoda Lagrangeova multiplikátoru se ukáže jako nepoužitelná. Je však třeba poznamenat, že takové úkoly jsou v praxi poměrně vzácné.

Uvažujme speciální případ společný úkol nelineární programování, za předpokladu, že systém omezení obsahuje pouze rovnice, neexistují podmínky pro nezápornost proměnných a a - funkce jsou spojité spolu s jejich parciálními derivacemi. Řešením soustavy rovnic (7) tedy získáme všechny body, ve kterých může mít funkce (6) extrémní hodnoty.

Algoritmus pro Lagrangeovu multiplikační metodu

1. Vytvořte Lagrangeovu funkci.

2. Najděte parciální derivace Lagrangeovy funkce vzhledem k proměnným x J ,λ i a přirovnejte je k nule.

3. Řešíme soustavu rovnic (7), najdeme body, ve kterých může mít účelová funkce úlohy extrém.

4. Mezi body podezřelými pro extrém najdeme ty, ve kterých je extrém dosaženo, a vypočítáme hodnoty funkce (6) v těchto bodech.

Příklad.

Počáteční údaje: Podle plánu výroby potřebuje společnost vyrobit 180 produktů. Tyto výrobky lze vyrábět dvěma technologickými způsoby. Při výrobě x 1 výrobků 1. způsobem jsou náklady 4x 1 +x 1 2 rublů a při výrobě x 2 výrobků 2. způsobem jsou to 8x 2 +x 2 2 rubly. Určete, kolik produktů by se mělo vyrobit pomocí každé metody, aby byly náklady na výrobu minimální.

Účelová funkce pro uvedený problém má tvar
® min za podmínek x 1 + x 2 = 180, x 2 ≥0.
1. Vytvořte Lagrangeovu funkci
.
2. Vypočítáme parciální derivace vzhledem k x 1, x 2, λ a přirovnáme je k nule:

3. Řešením výsledné soustavy rovnic zjistíme x 1 =91,x 2 =89

4. Provedením náhrady v účelové funkci x 2 =180-x 1 získáme funkci jedné proměnné, a to f 1 =4x 1 +x 1 2 +8(180-x 1)+(180-x 1 ) 2

Počítáme nebo 4x 1 -364=0 ,

odkud máme x 1 * =91, x 2 * =89.

Odpověď: Počet výrobků vyrobených první metodou je x 1 = 91, druhou metodou x 2 = 89, přičemž hodnota účelové funkce je rovna 17 278 rublům.

an(t)z(n)(t) + an − 1(t)z(n − 1)(t) + ... + a1(t)z"(t) + a0(t)z(t) = f(t)

spočívá v nahrazení libovolných konstant ck v ​​obecném řešení

z(t) = c1z1(t) + c2z2(t) + ...

Cnzn(t)

odpovídající homogenní rovnici

an(t)z(n)(t) + an − 1(t)z(n − 1)(t) + ... + a1(t)z"(t) + a0(t)z(t) = 0

k pomocným funkcím ck(t), jejichž derivace splňují lineární algebraický systém

Determinant systému (1) je Wronskián funkcí z1,z2,...,zn, který zajišťuje jeho jedinečnou řešitelnost vzhledem k .

Pokud jsou primitivní funkce pro , brané na pevné hodnoty integračních konstant, pak funkce

je řešením původní lineární nehomogenní diferenciální rovnice. Integrace nehomogenní rovnice v přítomnosti obecného řešení odpovídající homogenní rovnice se tedy redukuje na kvadratury.

Lagrangeova metoda (metoda variace libovolných konstant)

Metoda pro získání obecného řešení nehomogenní rovnice se znalostí obecného řešení homogenní rovnice bez nalezení konkrétního řešení.

Pro lineární homogenní diferenciální rovnici n-tého řádu

y(n) + a1(x) y(n-1) + ... + an-1 (x) y" + an(x) y = 0,

kde y = y(x) je neznámá funkce, a1(x), a2(x), ..., an-1(x), an(x) jsou známé, spojité, pravdivé: 1) lineárně je n rovnice nezávislého řešení y1(x), y2(x), ..., yn(x); 2) pro libovolné hodnoty konstant c1, c2, ..., cn je funkce y(x)= c1 y1(x) + c2 y2(x) + ... + cn yn(x) a řešení rovnice; 3) pro libovolné počáteční hodnoty x0, y0, y0,1, ..., y0,n-1 existují hodnoty c*1, c*n, ..., c*n takové, že řešení y *(x)= c*1 y1(x) + c*2 y2(x) + ... + c*n yn (x) splňuje počáteční podmínky y*(x0)=y0, (y*)"( x0) pro x = x0 =y0,1, ...,(y*)(n-1)(x0)=y0,n-1.

Výraz y(x)= c1 y1(x) + c2 y2(x) + ... + cn yn(x) se nazývá obecné rozhodnutí lineární homogenní diferenciální rovnice n-tého řádu.

Množina n lineárně nezávislých řešení lineární homogenní diferenciální rovnice n-tého řádu y1(x), y2(x), ..., yn(x) se nazývá základní soustava řešení rovnice.

Pro lineární homogenní diferenciální rovnici s konstantní koeficienty existuje jednoduchý algoritmus pro konstrukci základního systému řešení. Budeme hledat řešení rovnice ve tvaru y(x) = exp(lx): exp(lx)(n) + a1exp(lx)(n-1) + ... + an-1exp(lx) " + anexp(lx) = = (ln + a1ln-1 + ... + an-1l + an)exp(lx) = 0, tj. číslo l je kořen charakteristická rovnice ln + a1ln-1 + ... + an-1l + an = 0. Levá strana charakteristické rovnice se nazývá charakteristický polynom lineární diferenciální rovnice: P(l) = ln + a1ln-1 + ... + an-1l + an. Tím je problém řešení lineární homogenní rovnice n-tého řádu s konstantními koeficienty redukován na řešení algebraické rovnice.

Má-li charakteristická rovnice n různých reálných kořenů l1№ l2 № ... № ln, pak se základní systém řešení skládá z funkcí y1(x) = exp(l1x), y2(x) = exp(l2x), . .., yn (x) = exp(lnx) a obecné řešení homogenní rovnice je: y(x)= c1 exp(l1x) + c2 exp(l2x) + ... + cn exp(lnx).

fundamentální systém řešení a obecné řešení pro případ jednoduchých reálných kořenů.

Jestliže se některý z reálných kořenů charakteristické rovnice opakuje r-krát (r-násobný kořen), pak v fundamentální soustavě řešení je r funkcí, které mu odpovídají; pokud lk=lk+1 = ... = lk+r-1, pak in základní systémřešení rovnice zahrnují r funkcí: yk(x) = exp(lkx), yk+1(x) = xexp(lkx), yk+2(x) = x2exp(lkx), ..., yk+r- 1(x) =xr-1 exp(lnx).

PŘÍKLAD 2. Základní systém řešení a obecné řešení pro případ více reálných kořenů.

Pokud má charakteristická rovnice komplexní kořeny, pak každé dvojici jednoduchých (s násobností 1) komplexních kořenů lk,k+1=ak ± ibk v fundamentální soustavě řešení odpovídá dvojice funkcí yk(x) = exp(akx) cos(bkx), yk+ 1(x) = exp(akx)sin(bkx).

PŘÍKLAD 4. Základní systém řešení a obecné řešení pro případ jednoduchých komplexních kořenů. Pomyslné kořeny.

Pokud má komplexní dvojice kořenů násobnost r, pak taková dvojice lk=lk+1 = ... = l2k+2r-1=ak ± ibk, v fundamentální soustavě řešení odpovídá funkcím exp(akx)cos( bkx), exp(akx)sin(bkx), xexp(akx)cos(bkx), xexp(akx)sin(bkx), x2exp(akx)cos(bkx), x2exp(akx)sin(bkx), .. ...... ........ xr-1exp(akx)cos(bkx), xr-1exp(akx)sin(bkx).

PŘÍKLAD 5. Základní systém řešení a obecné řešení pro případ více komplexních kořenů.

Abychom tedy našli obecné řešení lineární homogenní diferenciální rovnice s konstantními koeficienty, měli bychom: zapsat charakteristickou rovnici; najít všechny kořeny charakteristické rovnice l1, l2, ... , ln; zapište základní soustavu řešení y1(x), y2(x), ..., yn(x); zapište výraz pro obecné řešení y(x)= c1 y1(x) + c2 y2(x) + ... + cn yn(x). K vyřešení Cauchyho problému je třeba dosadit výraz pro obecné řešení do počátečních podmínek a určit hodnoty konstant c1,..., cn, což jsou řešení systému lineárních algebraické rovnice c1 y1(x0) + c2 y2(x0) + ... + cn yn(x0) = y0, c1 y"1(x0) + c2 y"2(x0) + ... + cn y"n(x0 ) =y0,1, ......... , c1 y1(n-1)(x0) + c2 y2(n-1)(x0) + ... + cn yn(n-1)( x0) = y0,n-1

Pro lineární nehomogenní diferenciální rovnici n-tého řádu

y(n) + a1(x) y(n-1) + ... + an-1 (x) y" + an(x) y = f(x),

kde y = y(x) je neznámá funkce, a1(x), a2(x), ..., an-1(x), an(x), f(x) jsou známé, spojité, platné: 1 ) jestliže y1(x) a y2(x) jsou dvě řešení nehomogenní rovnice, pak funkce y(x) = y1(x) - y2(x) je řešením odpovídající homogenní rovnice; 2) je-li y1(x) řešením nehomogenní rovnice a y2(x) je řešením odpovídající homogenní rovnice, pak funkce y(x) = y1(x) + y2(x) je řešením nehomogenní rovnice; 3) jestliže y1(x), y2(x), ..., yn(x) je n lineárně nezávislých řešení homogenní rovnice a ych(x) - svévolné rozhodnutí nehomogenní rovnice, pak pro libovolné počáteční hodnoty x0, y0, y0,1, ..., y0,n-1 existují hodnoty c*1, c*n, ..., c*n takové, že řešení y*(x )=c*1 y1(x) + c*2 y2(x) + ... + c*n yn (x) + ych(x) splňuje počáteční podmínky y*(x0)=y0 , (y*)"(x0)=y0,1, ...,(y*)(n-1)(x0)=y0,n-1.

Výraz y(x)= c1 y1(x) + c2 y2(x) + ... + cn yn(x) + yч(x) se nazývá obecné řešení lineární nehomogenní diferenciální rovnice n-tého řádu.

Najít konkrétní řešení nehomogenních diferenciální rovnice s konstantními koeficienty s pravou stranou tvaru: Pk(x)exp(ax)cos(bx) + Qm(x)exp(ax)sin(bx), kde Pk(x), Qm(x) jsou polynomy stupně k a m ​​Existuje tedy jednoduchý algoritmus pro konstrukci konkrétního řešení, který se nazývá metoda výběru.

Metoda výběru nebo metoda nejisté koeficienty, je následující. Požadované řešení rovnice je zapsáno ve tvaru: (Pr(x)exp(ax)cos(bx) + Qr(x)exp(ax)sin(bx))xs, kde Pr(x), Qr(x ) jsou polynomy stupně r = max(k, m) s neznámými koeficienty pr , pr-1, ..., p1, p0, qr, qr-1, ..., q1, q0. Faktor xs se nazývá rezonanční faktor. K rezonanci dochází v případech, kdy mezi kořeny charakteristické rovnice je kořen l =a ± ib násobnosti s. Tito. jestliže mezi kořeny charakteristické rovnice příslušné homogenní rovnice je jeden takový, že jeho reálná část se shoduje s koeficientem v exponentu exponentu a jeho imaginární část se shoduje s koeficientem v argumentu goniometrická funkce na pravé straně rovnice a násobnost tohoto kořene je s, pak požadované parciální řešení obsahuje rezonanční faktor xs. Pokud taková shoda neexistuje (s=0), pak neexistuje žádný rezonanční faktor.

Dosazení výrazu pro konkrétní řešení do levá strana rovnice, získáme zobecněný polynom stejného tvaru jako polynom na pravé straně rovnice, jehož koeficienty jsou neznámé.

Dva zobecněné polynomy jsou si rovny právě tehdy, když jsou shodné koeficienty faktorů tvaru xtexp(ax)sin(bx), xtexp(ax)cos(bx) se stejnými mocninami t. Porovnáním koeficientů těchto faktorů získáme systém 2(r+1) lineárních algebraických rovnic pro 2(r+1) neznámých. Lze ukázat, že takový systém je konzistentní a má jedinečné řešení.



Novinka na webu

>

Nejoblíbenější