Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

NUMERICKÁ ANALÝZA PROCESů NAP2 Fyzikální modely (transportní rovnice, energetické a entropické principy). Empirické modely (neuronové sítě a regresní modely).

Podobné prezentace


Prezentace na téma: "NUMERICKÁ ANALÝZA PROCESů NAP2 Fyzikální modely (transportní rovnice, energetické a entropické principy). Empirické modely (neuronové sítě a regresní modely)."— Transkript prezentace:

1 NUMERICKÁ ANALÝZA PROCESů NAP2 Fyzikální modely (transportní rovnice, energetické a entropické principy). Empirické modely (neuronové sítě a regresní modely). Modely, které využívají analytická řešení (difuze). Identifikace modelů na základě co nejlepší shody s experimentem (optimalizace). Rudolf Žitný, Ústav procesní a zpracovatelské techniky ČVUT FS 2010

2 MODELY PROCESů NAP2 Rudolf Žitný, Ústav procesní a zpracovatelské techniky ČVUT FS 2010 Matematický model = matematický popis (program) charakteristik systému (rozložení teplot, rychlostí, tlaků, koncentrací, výkonu,...), jako funkce času t, místa a operačních parametrů (geometrie systému, materiálových vlastností, průtoků,...). Matematický model aparátu nebo systému Identifikace parametrů modelu na základě experimentu Vyhodnocení experimentů – diagnostika aparátů, např. diagnostika kolon, EEG Optimalizace operačních parametrů (optimalizace návrhu)

3 MODELY PROCESů NAP2 Rudolf Žitný, Ústav procesní a zpracovatelské techniky ČVUT FS 2010 Obecná klasifikace matematických modelů - Black box (černá krabička) – model založen výhradně na porovnání s experimentem. Tři základní typy jsou -Neuronové sítě (analogie neuronů v mozku – metoda umělé inteligence) -Regresní modely (korelace např. ve tvaru mocninových funkcí typu Nu=cRe n Pr m ) -Identifikace přenosu systému  (t), ze změřeného časového průběhu vstupu x(t) a výstupu y(t) systému. - White box (bílá krabička) – model je založen výhradně na ověřených fyzikálních principech: -na bilancích hmoty, hybnosti, energie (Fourierova a Fickova rovnice, Navier Stokesovy rovnice) -na energetických principech, hledané řešení minimalizuje celkovou energii systému (pružnost), -na simulacích náhodných pohybů a interakcí fiktivních částic (metody Monte Carlo, Boltzmann lattice…). - Grey box (šedá krabička) - modely, které se nachází mezi výše uvedenými extrémy. Příkladem jsou kompartment modely průtočných systémů, respektující fyzikální princip zachování hmoty, ale další principy (třeba bilance impulsu) jsou u nich nahrazeny empirickými korelacemi nebo daty.

4 Fyzikální principy NAP2 Modely kontinua (bílé krabičky) Inženýrské modely založené na fyzikálních principech často vycházejí ze tří bilancí (hmoty, hybnosti a energie). V diferenciálním tvaru: Zachování hmoty Zachování hybnosti Zachování energie Cauchyho rovnice rovnováhy. Platí pro pružnost stejně jako pro proudění, stlačitelné i nestlačitelné. Celková energie, součet vnitřní, kinetické a potenciální energie hustota tepelného toku výkon vnitřních sil Většina rovnic, které znáte, se z těchto rovnic dá odvodit: Bernoulliho, Eulerova, Fourierova Kirchhoffova Navier Stokesova.

5 Fyzikální principy NAP2 Modely kontinua (bílé krabičky) Zvláště v mechanice tuhé fáze se dává přednost principům založených na energii. V nauce o pružnosti je to Lagrangeův princip minima celkové potenciální energieminima celkové potenciální energie deformační energie vnitřních sil (součin tenzoru deformace a napětí) práce vnějších sil (objemové, povrchové, osamělé) u WiWi WeWe W(u) deformace i napětí lze vyjádřit jako funkce posunutí u ve stavu rovnováhy má celková potenciální energie (W i +W e ) minimum Požadavek nulové variace funkcionálu energie  W/  u=0 je základem konstrukce mnoha konečných prvků. V dynamice je tento přístup reprezentován Hamiltonovým principem požadavku nulové variace funkcionálu, do něhož je zahrnuta i kinetická energieHamiltonovým principem „Energetické“ principy nejsou tak obecné: z každého variačního principu lze odvodit jemu ekvivalentní Eulerovy Lagrangeovy diferenciální rovnice, ale obráceně to neplatí. Především u proudění lze aplikovat variační principy jen v některých případech (třeba plouživého proudění).

6 Fyzikální principy NAP2 Typy modelů souvisí s typem problémů a s typem inženýrů, kteří se řešením těchto problémů zabývají: FUNKCIONALISTÉ Představují si, že každý systém může nabývat nekonečně mnoha podob, a každé podobě přiřadí nějaké číslo, funkcionál. Pak si tato čísla vynesou do grafu a hledají místa, která jsou něčím zvláštní, obvykle minima, maxima, inflexe. A těmto místům přiřadí zvláštní mystický význam, třeba to, že reprezentují stav rovnováhy, stav ztráty stability apod. Pohybují se zejména v oblasti pružných těles, solidů a jsou tudíž obvykle SOLIDNÍ. Snadno je poznáte podle toho, že za jedinou použitelnou numerickou metodu považují konečné prvky (se skřípěním zubů snad i Boundary elements) a používají slůvka jako Cauchy Green tenzor, Kirchhoff - Piola stresses, sedmý invariant apod. DIFERENCIÁLOVÉ Věří zákonu zachování hmoty, hybnosti a energie a domnívají se, že z těchto bilancí dokáží popsat stav systému v nekonečně blízkém okolí libovolného bodu diferenciálními rovnicemi. Z řešení těchto rovnic pak věští realitu celku. Pohybují se zejména v oblasti transportních jevů a proudění, jsou to PROUDNÍCi. Při výběru numerické metody nejsou příliš vybíraví, každá metoda, která vyřeší jejich rovnice je jim dost dobrá, ale většinou volí metodu konečných objemů. Často používají slůvka jako materiálová derivace. PARTIKULARISTÉ Nevěří v mechaniku kontinua. Vše lze odvodit z mechaniky hmotného bodu. Existují pouze diskrétní veličiny jako v číslicových počítačích. Složitost reality je způsobena velkým množstvím paralelně běžících jednoduchých procesů. Poznáte je podle toho, že se straní všech ostatních a jsou DISKRÉTNÍ. FATALISTÉ Nevěří, že je v lidských silách poznat zákony božské prozřetelnosti a proto se omezují na popis pozorovaných jevů, jsou to EMPIRICI. Milují expertní systémy, metody umělé inteligence, inženýrské korelace a statistiku, i když se pragmaticky nevyhýbají ani používání šedých krabiček. CHAOTI Připouští existenci nějakých principů, ale nevěří v jejich smysluplnou řešitelnost. Nesnáší hladké křivky a raději je kazí třeba generátory náhodných čísel. Milují katastrofy, podivnosti a atraktory, jsou ATRAKTIVNÍ. Zvláště pro ženy, které okouzlují cizími slovy a barevnými květinami fraktálů.

7 Příklady modelů-sušení NAP2 Rudolf Žitný, Ústav procesní a zpracovatelské techniky ČVUT FS 2010 Téměř vždy lze jako matematický model použít kterýkoliv z předchozích typů. Jako příklad (který nás v různých obměnách bude provádět celým kurzem) uvedeme sušení nebo zvlhčování materiálu, třeba zrna (škrobového, obilného, rýžového, kávového…). Vždy bude jedním ze základních výsledků modelu doba sušení nebo zvlhčování (resp. závislosti měrné vlhkosti na čase a na teplotě). Pro tento cíl většinou stačí jednoduché regresní modely nebo neuronové sítě. Pro stanovení mikrobiální aktivity, zdravotní nezávadnosti je třeba znát i distribuci vlhkosti uvnitř zrna. Pak nastupují modely bílé nebo šedé krabičky, modely založené na transportních rovnicích difúze a tepla. Když je geometrie zrna jednoduchá (kulička), a když není příliš významný vliv vlhkosti na difúzní součinitel, dá se řešení vyjádřit ve tvaru nekonečné řady (analytické řešení Fickovy a FK rovnice) nebo se spokojíme třeba jen s prvním (dominujícím) členem řady. Když je jednoduchá geometrie, ale silně nelineární koeficienty difúze a přenosu tepla, použije se zpravidla některá 1D numerická metoda (metoda sítí nebo spektrální metoda). U tvarově komplikovaných zrn (rýže, kávová zrna) se používají 3D numerické metody konečných prvků nebo kontrolních objemů (zpravidla se využijí komerční programy ANSYS, COMSOL nebo FLUENT). V současnosti je předmětem zájmu i měnící se vnitřní struktura materiálu, např. vznik trhlin, které zpětně transport vlhkosti výrazně ovlivňují (volná voda snáze proniká mikrotrhlinami zrna). To ovšem znamená, že kromě transportních rovnic se musí řešit i pole deformací a rozložení tenzoru mechanických napětí (pružnostní problém). Je to o to složitější, že u biologických materiálů jde o velké deformace (nelze tedy použít teorii malých deformací a např.Hookův zákon jako u běžných ocelových konstrukcí). Modely jsou zpravidla založené na metodě konečných prvků.

8 Neuronové sítě NAP2 Umělé neuronové sítě jsou technikou brutální umělé inteligence. Její obliba vyplývá z toho, že čím dál tím větší počet lidí ví o reálných procesech a jejich podstatě čím dál méně (snad by se to dalo nazvat zákonem exponenciálního růstu ignorance). ANN (Artificial Neural Network) jsou určeny právě pro ty, kteří o procesech, které chtějí modelovat, neví vůbec nic a ani nechtějí o jejich principech příliš přemýšlet. Mají jen spoustu experimentálních dat v nichž nejsou schopni se orientovat. A mají k dispozici MATLAB (například). MATLAB Schiele

9 Neuronové sítě NAP2 Neuron=modul, který vypočte jednu výstupní hodnotu z několika vstupních. Chování konkrétní neuronové sítě je dáno hodnotami synaptických váhových koeficientů w i (koeficientů zesílení signálů mezi propojenými neurony) Vstupní vrstva (zde 2 neurony) X 1,X 2 Skrytá vnitřní vrstva (zde 4 neurony) Výstupní vrstva (zde 1 neuron) Y Odezva neuronu y na N-vstupních hodnot x i Nejčastěji používané aktivační funkce f (tangens hyperbolický, sigmoidální funkce, znaménková funkce) W i =koeficienty synaptických vah stanovené speciálními algoritmy „učení“ sítě Nejčastěji používané aktivační funkce f (tangens hyperbolický, sigmoidální funkce, znaménková funkce) Nejčastěji používané aktivační funkce f (tangens hyperbolický, sigmoidální funkce, znaménková funkce sgn). Vše je implementováno např. v MATLABu.

10 Neuronové sítě NAP2 Modeling of wheat soaking using two artificial neural networks (MLP and RBF)Modeling of wheat soaking using two artificial neural networks (MLP and RBF) Journal of Food Engineering, Volume 91, Issue 4, April 2009, Pages M. Kashaninejad, A.A. Dehghani, M. Kashiri V tomto článku se dočtete jak byly vyhodnoceny experimenty zvlhčování obilních zrn. V experimentech byla zrna zvlhčována v destilované vodě při teplotách 25, 35, a 65 0 C po dobu cca 15 hodin (v 15 minutových intervalech byly váženy vzorky), celkem bylo k dispozici 154 hodnot měrné vlhkosti zrn pro různé teploty a časy. Z těchto hodnot bylo 99 dat použito pro trénování sítě, která měla dva neurony ve vstupní vrstvě (čas, teplota), 26 neuronů ve skryté vrstvě a jediný výstupní neuron (vlhkost). Zbývajících 55 dat (vlhkostí) bylo použito k ověření toho, že „natrénovaná“ neuronová síť dává rozumné výsledky a jaká je asi chyba predikce. Použily se dva typy sítě MLP (Multi Layer Perceptron) a RBF (Radial Base Functions) lišící se aktivačními funkcemi neuronů (sigmoidální, resp. Gaussovská bázová funkce). Takto vypadá výsledek predikce neuronové sítě (ANN). MR-Moisture Ratio jako funkce času a teploty. MLP je klasická neuronová síť. Aktivační funkce neuronů (tangens hyperbolický,…viz předchozí folie) nemají žádné nastavitelné parametry, optimalizují se jen váhové koeficienty w ij propojující neuron i s neuronem j (a používají se stejné metody jako u dále popisovaných regresních modelů). Radiální bázové funkce neuronů RBF mají své vlastní nastavitelné parametry – souřadnice centra neuronu (určuje „vzdálenost“ centra neuronu od jednotlivých neuronů předchozí vrstvy) a „šířka“ bázové funkce. RBF jsou Gaussovské funkce RBF sítě mají jen jedinou skrytou vrstvu a váhové koeficienty w ij se nastavují jen mezi skrytou a výstupní vrstvou. Parametry „radiálních“ neuronů (x c,  c ) se volí „ad hoc“ dle povahy problému, využívají se přitom statistické strategie typu „cluster analysis“. Je to složitější než MLP a výsledek (alespoň u sušení) bývá horší.

11 Regresní modely NAP2 Delvaux

12 NAP2 Regresní model má podobu relativně jednoduché funkce nezávisle proměnné x, a parametrů p 1, p 2,…,p M, které je třeba určit tak, aby se hodnota funkce co nejlépe shodovala s experimentálními hodnotami y. Upřímně řečeno neuronové sítě jsou téměř to samé, hledané parametry p 1, p 2,…,p M jsou koeficienty synaptických vah propojení neuronů. Rozdíl je v tom, že typ modelové funkce je u ANN víceméně unifikovaný a těch váhových koeficientů bývá mnohem více než počet parametrů běžně používaných regresních funkcí. Regresní funkce se volí na základě zkušeností nebo zjednodušených představ o modelovaném ději (požaduje se třeba rozumné a logicky vysvětlitelné chování při velmi malých nebo velkých hodnotách nezávisle proměnných). Je rovněž žádoucí aby parametry p 1, p 2,…,p M měly jasně definovaný fyzikální smysl. Nicméně je pravdou, že když neznáme fyzikální podstatu procesu nebo je příliš složitá (tj. stejná situace jako u neuronových sítí) volí se regresní funkce jako polynom y= p 1 +p 2 x+…+p M x M-1 nebo nějaká jiná „neutrální“ funkce. Regresní modely

13 NAP2 Uvažujme regresní model s hledaným vektorem M parametrů p Tyto parametry musí být stanoveny tak, aby se predikce modelu co nejvíce shodovala s N naměřenými daty (x i,y i ). Nejčastěji používaným kriteriem shody je kriterium chi-kvadrát (součet čtverců odchylek) Veličina  i je směrodatná odchylka naměřené veličiny y i (chyba měření). Problém regrese je tedy optimalizační úloha hledání minima funkce  2 v prostoru parametrů p 1, p 2,…,p M (ale používají se i jiná robustnější kriteria shody, např. součet absolutních hodnot odchylek). Kvalita zvoleného modelu se hodnotí tzv. korelačním indexem, který by měl být blízký jedničce Regrese má smysl jen když je počet dat N vyšší než počet hledaných parametrů modelu M (kdyby byl stejný šlo by o interpolaci) Hodnota r=0 odpovídá situaci, kdy by bylo lepší nahradit regresní model konstantou (průměrem naměřených dat ) Regresní modely

14 NAP2 Lineární regresní model je lineární kombinace zvolených bázových funkcí, což mohou být třeba polynomy g m (x)=x m-1 nebo goniometrické funkce g m (x)=sin(mx) Predikci modelu můžeme vyjádřit v maticovém tvaru [[A]] je návrhová matice jejíž N řádků odpovídá N-datům, a M sloupců bázovým funkcím. N>M, případ čtvercové matice N=M není regrese, ale interpolace, koeficienty [p] se stanoví řešením soustavy M rovnic pro M neznámých. U regrese je víc rovnic (N) než neznámých (M). Pokud je směrodatná odchylka měřených dat u všech bodů stejná, je  2 úměrné součtu čtverců odchylek vektoru predikce [y predikce ] a naměřených dat [y] Maticově je to vlastně skalární součin vektoru odchylek Regresní modely lineární regrese Na první pohled by se mohlo zdát, že bázové funkce jsou analogií aktivačních funkcí neuronů a parametry p m odpovídají synaptickým vahám. Jenže aktivační funkce všech neuronů jsou stejné, zatímco bázové funkce musí být rozdílné a lineárně nezávislé.

15 NAP2 Podmínkou minima funkce s 2 jsou nulové první derivace vzhledem ke všem parametrům modelu což je soustava M lineárních algebraických rovnic pro vektor neznámých parametrů Transponovaná matice [[A]] T má rozměr MxN a když je vynásobena maticí [[A]] NxM je výsledkem čtvercová matice s rozměrem MxM [[C]] MxM Matice soustavy [[C]] umožňuje i odhad intervalu spolehlivosti vypočtených parametrů p 1,…,p M Transponovaná matice [[A]] T má rozměr MxN a když je vynásobena vektorem [y] Nx1 je výsledkem vektor M-hodnot  pk je směrodatná odchylka vypočteného parametru p k pro k=1,2,…,M  y je směrodatná odchylka měřených dat (předpokládáme, že je ve všech bodech stejná) Matici [[C]] je ovšem třeba invertovat (říká se jí kovarianční matice parametrů modelu) Regresní modely lineární regrese

16 Regresní modely příklad – filtrace šumu NAP2 Lineární regresní modely (používající obyčejné polynomy nízkého stupně) se výborně hodí pro vyhlazování zašuměného signálu. Princip (filtr Savitzky Golay) je jednoduchý: každému bodu vstupních dat x i,y i se přiřadí N w bodů vlevo a N w bodů vpravo (okénko), a těmito 2N w +1 body se lineární regresí proloží polynom (k-tého stupně, kde k<2N w ). Hodnotou tohoto polynomu v bodě x i se pak nahradí původní hodnota y i. Počet dat N=1024, šířka okénka 50, kvadratický regresní polynom. V MATLABu je tato regresní filtrace implementována jako funkce SGOLAYFILT(X,K,F) kde X je vstupní vektor zašuměných dat, K je stupeň regresního polynomu a F=2N w +1 je šířka okna. Application in extruder processing hmed(k)=median(h(i1:i2));... dpdt(1:nd)=sgolayfilt(dpd(1:nd),1,101);

17 Regresní modely příklad - zvlhčování NAP2 The application of Peleg's equation to model water absorption during the soaking of red kidney beans (Phaseolus vulgaris L.)The application of Peleg's equation to model water absorption during the soaking of red kidney beans (Phaseolus vulgaris L.) Journal of Food Engineering, Volume 32, Issue 4, June 1997, Pages Nissreen Abu-Ghannam, Brian McKenna Pro modelování závislosti absorbované vlhkosti zrn na čase se používá několik různých regresních modelů, např. exponenciální Pageův model X e je rovnovážná, X O počáteční vlhkost zrna Model má 2 parametry p 1 =k, p 2 =n. Nezávisle proměnná t je čas a ještě častěji používaný Pelegův model (viz článek týkající se fazolí) Ani Pageův ani Pelegův model není lineární a tak se trochu „fixluje“. Pageův model lze převést na lineární dvojím logaritmováním, Pelegův model ještě jednodušeji úpravou na tvar To je teď nová závisle proměnná y Parametr p 2 charakterizuje rovnovážnou vlhkost zrna Pelegův model se používá pro luštěniny, soju, ořechy, cizrnu, hrách… …a pak se použije lineární regrese pro stanovení p 1 a p 2

18 Regresní modely zvlhčování NAP2 Na předchozí folii bylo uvedeno, že linearizací modelu se trochu „fixluje“. Jde o to, že když použijeme lineární regresí stanovené parametry v původním nelineárním modelu, nebude dosaženo minima součtu čtverců odchylek od měřené vlhkosti (a našla by se asi lepší kombinace parametrů p 1, p 2 ). V praxi se tento rozdíl zanedbává i když je trochu komické, že i pak se povinně počítají kovarianční matice, korelační index a podobné statistiky, jejichž význam je poněkud sporný.

19 Analytická řešení modely difúze a tepla NAP2 Vermeer

20 Analytická řešení NAP2 Analytická řešení hledejte především u lineárních rovnic Obyčejné diferenciální rovnice: Parciální diferenciální rovnice: existují dva základní přístupy všechny analytické funkce, které znáte (i neznáte), např. sin, cos, exp, tgh, Besselovy funkce,… jsou vlastně definovány jako řešení určitých typů diferenciálních rovnic (řešení hledejte v příručkách, např. Kamke E: Differential Gleichungen, Abramowitz M., Stegun I.: Handbook of Mathematical functions). Obecný postup spočívá ve vyjádření řešení ve tvaru mocninové řady, jejíž koeficienty získáte dosazením do diferenciální rovnice. Fourierova metoda separace proměnných. Řešení F(t,x,y,z) se hledá ve tvaru součinu funkcí, které závisí jen na jediné proměnné F=T(t)X(x)Y(y)Z(z). Dosazením do parciální diferenciální rovnice získáte obyčejné diferenciální rovnice. Na diferenciální rovnici aplikujte integrální transformaci: Fourierovu, Laplaceovu, Hankelovu. Výsledkem je algebraická rovnice, kterou je třeba vyřešit a pak použít zpětnou transformaci.Fourierovu LaplaceovuHankelovu

21 Rozložení vlhkosti X (kg vody/kg sušiny) popisuje pro případ konstantního součinitele difúze vody v materiálu Fickova rovnice m=0,1,2 pro desku, válec, kouli. Pro všechny tři základní geometrie lze nalézt analytické řešení Fourierovou metodou separace proměnných. Řešení se hledá ve tvaru součinu funkcí polohy r a času t Dosazením do Fickovy parciální diferenciální rovnice získáme obyčejné diferenciální rovnice pro funkce G i (t) i F i (r * ) Toto závisí pouze na čase t Toto může záviset pouze na r Nemůže to záviset ani na r ani na t, takže to musí být konstanta. Konstanty  (tzv. vlastní hodnoty) se volí tak, aby řešení splňovalo okrajovou podmínku na povrchu (například nulovou hodnotu X pro r=R). X e je rovnovážná vlhkost, X 0 je počáteční vlhkost NAP2 Analytická řešení difúze

22 Řešením rovnice pro G i (t) je ve všech třech případech exponenciála, řešení rovnice pro F i (r) je cos(  r) pro desku (m=0), Besselova funkce J 0 (  r) pro válec (m=1) a pro kouli (m=2, což nás u kulových zrnek zajímá nejvíc) Pokud je na povrchu koule (r * =1) udržována fázová rovnováha (X=X e ), tj. když je na povrchu zajištěn dostatečně intenzivní přenos hmoty, je X * (t,1)=0 a tuto podmínku musí splňovat každá funkce F i. A to je podmínka pro vlastní hodnoty Bezrozměrný koncentrační profil má tedy tvar Zatím neurčené koeficienty c i musí být stanoveny tak, aby řešení splňovalo počáteční podmínku, tj. rozložení koncentrace v čase nula. Pro konstantní koncentraci X=X 0 tedy musí pro každé r * platit X * =1 NAP2 Analytická řešení difúze

23 NAP2 Analytická řešení difúze Pro stanovení koeficientů c i využijeme zajímavou vlastnost funkcí F i (r * ), které se říká ortogonalita. Dvě funkce jsou ortogonální, když jejich skalární součin je roven nule. Skalární součin je v případě funkcí definován jako integrál jejich součinu (násobený event. nějakou váhovou funkcí) Ortogonalita funkcí je výborná vlastnost, která se uplatní i v řadě jiných aplikací. Když např. použijeme při regresi jako bázové funkce g m (x) ortogonální polynomy všechno se zjednoduší a zpřesní (nemusí se řešit soustavy rovnic, zmizí problém zaokrouhlovacích chyb) Důkaz ortogonality vlastních funkcí F i To jsou vlastně definiční diferenciální rovnice pro funkce F i a F j. Můžeme je odečíst a integrovat. Integrace per partes. A to je nula, protože obě vlastní funkce musí splňovat okrajové podmínky (nulová derivace.v centru koule a nulová hodnota na povrchu)

24 NAP2 Analytická řešení difúze Aplikujme ortogonalitu na předchozí rovnici (vynásobenou r 2 F j a integrovanou) Prosím, zkuste ověřit, že to tak je (je to jen malé cvičení integrace per partes) Výsledkem je tedy koncentrační profil vlhkosti nebo (integrací přes objem koule) celková vlhkost jako funkce času

25 Heat and mass transfer during the coffee drying processHeat and mass transfer during the coffee drying process Journal of Food Engineering, Volume 99, Issue 4, August 2010, Pages Katrin Burmester, Rudolf Eggers Modeling and simulation of heat and mass transfer during drying of solids with hemispherical shell geometryModeling and simulation of heat and mass transfer during drying of solids with hemispherical shell geometry Computers & Chemical Engineering, Volume 35, Issue 2, 9 February 2011, Pages I.I. Ruiz-López, H. Ruiz-Espinosa, M.L. Luna-Guevara, M.A. García-Alvarado Difúzní součinitel D ef ovšem závisí na teplotě, dokonce i na vlhkosti a stejně tak i rovnovážná vlhkost X e je funkcí teploty. Je tedy třeba vzít do hry ještě další korelace, např. I když je použito analytické řešení, je výsledkem silně nelineární regresní model se třemi parametry p 1 =D wa, p 2 =E a a p 3 =b. Tento model použila Katrin Burmester při hledání optimálního režimu pražení kávových zrn Poznamenejme, že i tak je použití analytického řešení jen aproximací (protože i při izotermním experimentu je difúzní součinitel D ef proměnný) a i předchozí článek uvádí kromě analytického řešení, numerické řešení metodou sítí uvažující i proměnný teplotní profil v praženém zrnu kávy. Tomu se budeme věnovat později. NAP2 Analytická řešení difúze

26 Optimalizace NAP2 Pro hledání parametrů p i silně nelineárních modelů, které minimalizují  2, se používají dva základní typy metod:  Bezderivační, kterým pro stanovení minima stačí jen možnost vyčíslování s 2 (nebo jiného zvoleného kriteria shody predikce a experimentu) pro libovolné hodnoty parametrů modelu. Metody tohoto typu jsou nutné u velmi komplikovaných regresních modelů, například když se predikce počítá metodou konečných prvků.  Derivační, které využívají i hodnoty všech prvních (někdy i druhých) derivací regresního modelu vzhledem ke všem parametrům p 1,p 2,…,p M.

27 Optimalizační metody derivační NAP2 Gaussova metoda hledání minima součtu vážených čtverců odchylek Váhové koeficienty mohou být třeba převrácené hodnoty variancí (čtverců očekávaných chyb) Podmínkou minima jsou nulové první derivace vzhledem ke všem parametrům j=1,2,…,M Regresní funkci je možné linearizovat, aproximovat ji pouze lineárními členy Taylorova rozvoje  p je jen vektor přírůstku parametrů modelu v jedné iteraci data mod el

28 Optimalizační metody derivační NAP2 V každé iteraci Gaussovy metody se tedy řeší soustava lineárních rovnic pro vektor přírůstku parametrů V současnosti asi nejčastěji používaná metoda Marquardt Levenberg je mírnou modifikací Gaussovy metody: když iterace nekonvergují, přidává se k diagonále matice [[C]] konstanta. Když je velmi velké stává se matice [[C]] diagonální a Gaussova metoda přechází na metodu gradientní (pravá strana je vlastně jen vektor gradientu minimalizované funkce s 2 ). Hodnota se během iterací mění, když iterace konvergují, se zmenšuje a preferuje se velice rychlá Gaussova metoda, když divergují, tak se zvyšuje (gradientní metoda je sice pomalejší, ale spolehlivější).Marquardt Levenberg

29 Optimalizační metody bez derivační NAP2 Nejjednodušší je případ optimalizace jediného parametru (M=1). Nejprve je třeba lokalizovat optimální hodnotu parametru do nějakého intervalu ve kterém je jen jediné minimum (interval neurčitosti). Přesná poloha minima se pak určí buď metodou půlení intervalu (ale na rozhodnutí, zda řešení leží „vlevo“ nebo „vpravo“ jsou třeba dvě hodnoty regresní funkce) nebo metodou zlatého řezu (Golden Section, interval neurčitosti se v každém kroku zkracuje sice jen v poměru a ne v poměru 0.5, ale stačí zase jen jedna hodnota regresní funkce). Viz algoritmus Golden section search a následující folie (definice zlatého řezu)Golden Section Golden section search f1f1 f2f2 f3f3 f4f4 L1L1 L 2 =0.618L 1 L 3 =0.618L 2 V původním intervalu neurčitosti (délky L 1 ) se vypočtou f 1 f 2 ve zlatých řezech. Porovnáním f 1 >f 2 plyne, že minimum nemůže být vlevo. V novém intervalu neurčitosti L 2 opět potřebujeme dvě hodnoty f pro porovnání, ale jedna z nich (f 2 ) už je spočítaná, protože bod ve zlatém řezu starého intervalu je i ve zlatém řezu nového intervalu – to je právě ta základní vlastnost zlatého řezu a magie čísla Stačí tedy výpočet jediné hodnoty f 3 !

30 Zlatý řez NAP2 A B C1 C2 a p q kvadratická rovnice pro poměr zlatého řezu q/p

31 Optimalizační metody bez derivační NAP2 Problém do testu: Kolik kroků metody zlatého řezu a kolik funkčních hodnot regresní funkce je třeba vyčíslit, když požadujeme zmenšení intervalu neurčitosti třeba tisíckrát? Pro tisícinásobné zpřesnění (m=1000) tedy stačí cca 14 kroků. An approach to determine diffusivity in hardening concrete based on measured humidity profilesAn approach to determine diffusivity in hardening concrete based on measured humidity profiles Advanced Cement Based Materials, Volume 2, Issue 4, July 1995, Pages D. Xin, D. G. Zollinger, G. D. Allen V tomto článku se řeší difúzní rovnice (ale ne zrna, tuhnutí betonu) a pro stanovení difúzního součinitele je použita metoda zlatého řezu (regresní model je definován jako numerické řešení difúzní rovnice-kolokační metoda).

32 Optimalizační metody bez derivační NAP2 Metody jednorozměrného hledání lze aplikovat i na problémy s více parametry p 1,…,p M, prostě se opakuje jednorozměná optimalizace pro každý parametr zvlášť (Rosenbrock).Rosenbrock Asi nejčastěji používaná je simplexová metoda Nelder Mead. Její princip je prostý:Nelder Mead Animovaný gif převzatý z wikipedia.org 1. Generuje se simplex tvořený náhodně zvolenými M+1 vrcholy (pro dva parametry p 1 p 2 je to trojúhelník). 2. V každém vrcholu simplexu se vyčíslí regresní funkce f a vybere se nejhorší vrchol. Ten se nahradí buď překlopením, kontrakcí nebo expanzí. Krok 2 se opakuje dokud se simplex dostatečně nezmenší

33 MATLAB NAP2

34 Optimalizační metody MATLAB NAP2 V MATLABU je snadná lineární polynomická regrese p=polyfit(x,y,m) a minimalizace funkce více proměnných (bez omezení „constraints“, metoda Nelder Mead) p=fminsearch(fun,p0) kde fun je odkaz (“handle” začínající na uživatelem definovanou funkci, která pro hodnoty parametrů modelu předá hodnotu, která má být mimalizována (třeba součet čtverců odchylek experimentálních dat od matematického modelu). Vektor p0 jsou zadávané počáteční hodnoty – nástřel. Pro nelineární regresi (nelineární modely) jsou k dispozici p = nlinfit(x,y,modelfun,p0) ci = nlparci(p,resid,'covar',sigma) umožňuje statistické zpracování výsledků (kovarianční matice, intervaly spolehlivosti predikce i počítaných parametrů modelu)

35 Optimalizační metody MATLAB NAP2 time X(moisture) xdata=[ ]’; ydata=[ …]’; Příklad: Byla naměřena sušící křivka, 10 bodů (čas a vlhkost) matice a vektory jde definovat výčtem v lomených závorkách []. Prvky, které tvoří řádek matice jsou odděleny mezerami, středník znamená přechod na nový řádek. Apostrof [vektor]’ znamená transpozici, místo řádkového bude výsledkem sloupcový vektor data vykreslíme příkazem plot(xdata,ydata,’*’)

36 Optimalizační metody MATLAB NAP2 Body sušící křivky můžeme proložit polynom třetího stupně p 1 x 3 +…+p 4 p=polyfit(xdata,ydata,3) p = Polynom s koeficienty p(1)=0.0001, p(2)= …vykreslíme např. takto Y=polyval(p,xdata) hold on plot(xdata,ydata,'*') plot(xdata,Y) vyčíslení hodnot polynomu do vektoru Y hold on umožňuje kreslit více křivek do jednoho grafu to celé šlo udělat i bez použití vektoru predikce Y jediným příkazem plot(xdata,ydata,'*',xdata,polyval(p,xdata)) vektor vypočtených koeficientů polynomu (ve směru klesajících mocnin)

37 Optimalizační metody MATLAB NAP2 kde A je „škálovací“ koeficient a fyzikální význam má difúzní koeficient D ef a poloměr charakteristické částice R. D ef a R ovšem nejsou nezávislé parametry, protože v modelu figuruje jen jejich poměr D ef /R 2, převrácená hodnota časové konstanty sušení. Pokud tedy poloměr R zvolíme (např. R=0.01 m) je cílem optimalizace nalezení dvou regresních parametrů A, D ef, které minimalizují zvolené kriterium shody modelu a naměřených bodů sušící křivky (součet čtverců odchylek, nebo „robustnější“ kriterium součtu absolutních hodnot odchylek, které není tak citlivé na chybně naměřené body, tzv. „outliers“). Jak to udělat?  Definuj funkci xmodel(t,p,pa) jako součet řady (vektor parametrů p 1 =A, p 2 =D ef, pa 1 =R, pa 2 =n)  Definuj funkci, která spočítá součty odchylek xdev(xmodel,p,pa,xdata,ydata)  použij knihovní funkci pro hledání minima p= fminsearch(xdev,p0) Fyzikálně správnější model sušící křivky může být založen na difúzním modelu

38 Optimalizační metody MATLAB NAP2 Takže nejprve definice modelu function xval = xmodel(t,p,pa) A=p(1); D=p(2); R=pa(1); ni=pa(2); xv=0; for i=1:ni pii=(pi*i)^2; xv=xv+6/pii*exp(-pii*D*t/R^2); end xval=A*xv; Takto lze definovat jakýkoliv model sušení, třeba i ten předchozí kubický polynom, Pelegův či Pageův model nebo model popisovaný diferenciálními rovnicemi. Model založený na diferenciálních rovnicích by však musel byl integrován pro každou hodnotu času t znovu – pro takové případy by byla efektivnější jiná strategie, vyhodnocení predikce modelu ve všech časech t (v celém vektoru xdata) současně. tento text musí být uložen jako M-file se jménem souboru stejným jako je název funkce, tedy xmodel.m

39 Optimalizační metody MATLAB NAP2 Funkce definující zvolené kriterium shody (např. součet čtverců odchylek) function sums = xdev(model,p,paux,xdat,ydat) sums=0; n=length(xdat); for i=1:n sums=sums+(model(xdat(i),p,paux)-ydat(i))^2; end tento text musí být uložen jako M-file se jménem souboru stejným jako je název funkce, tedy xdev.m Definice pomocných parametrů a hledání regresních parametrů funkcí fminsearch pa=[0.01,10] p = R=0.01 a počet členů řady n=10 první parametr fminsearch může být pouze funkce s jediným parametrem, vektorem p optimalizovaných parametrů. To, že pro vyčíslení odchylky potřebujeme zadat i další hodnoty se v MATLABu řeší použitím tzv. anonymní expression. druhý parametr funkce fminsearch je vektor nástřelu

40 Optimalizační metody MATLAB NAP2 function [estimates, model] = fitcurve(xdata, ydata) start_point = [ ]; Hledané parametry jsou dva: A,D. Počáteční odhad. model Expfun je predikce modelu a výpočet součtu čtverců odchylek estimates = fminsearch(model, start_point); volání optimalizační Nelder Mead metody function [sse, FittedCurve] = expfun(params) A = params(1); optimalizovaný škálovací parametr D = params(2); optimalizovaný difuzní koeficient R=0.01; poloměr částice (když ho chcete změnit musíte opravit funkci fitcurve.m) ni=10; počet členů řady(správně nekonečno, ale 10 obvykle stačí) ndata=length(xdata); (počet bodů naměřené křivky sušení) sse=0; výsledek expfun – součet čtverců odchylek for idata=1:ndata xv=0; tady je třeba naprogramovat konkrétní model sušení (Y(X,params)) for i =1:ni pii=( pi * i )^2; xv=xv+6/pii*exp(-pii*D*xdata(idata)/R^2); end FittedCurve(idata) = A* xv; ErrorVector(idata) = FittedCurve(idata) - ydata(idata); sse=sse+ErrorVector(idata)^2; end [estimates, model] = fitcurve(xdata,ydata) Přesně to samé lze naprogramovat i do jediného M-filu

41 Co je třeba si pamatovat NAP2 Minimum toho, co byste si z této přednášky věnované především minimalizaci pamatovat (alespoň ke zkoušce), je na následující folii

42 Co je třeba si pamatovat NAP2 Triáda bilančních rovnic Lagrangeův variační princip (minimum W i +W e ) Kriterium shody mezi modelem a realitou (chi-kvadrat) Princip regrese (parametry p minimalizující chi-kvadrat) Jak minimalizovat chi-kvadrat, když je regresní model nelineární funkcí parametrů p Minimalizační metody derivační (Marquardt Levenberg) a bezderivační (zlatý řez, simplexová metoda Nelder Mead)


Stáhnout ppt "NUMERICKÁ ANALÝZA PROCESů NAP2 Fyzikální modely (transportní rovnice, energetické a entropické principy). Empirické modely (neuronové sítě a regresní modely)."

Podobné prezentace


Reklamy Google