Minimalizace součtu čtverců - úvod

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Matematická analýza Lineární algebra Diferenciální rovnice
Komplexní čísla. Komplexní číslo je uspořádaná dvojice [x, y], kde číslo x představuje reálnou část a číslo y imaginární část. Pokud je reálná část nulová,
Nelineární optimalizace s omezeními - obecně
Optimalizace bez omezení (unconstraint)
Elektrické obvody – základní analýza
OBECNÉ OPTIMALIZAČNÍ MODELY
Výsledný odpor rezistorů spojených v elektrickém poli za sebou
MATLAB LEKCE 7.
Rovnice roviny Normálový tvar rovnice roviny
Geometrický parametr reaktoru různého tvaru
4. Metoda nejmenších čtverců
Vzorová písemka Poznámka: Bonusové příklady jsou nepovinné, lze za ně ale získat body navíc. (2 body) Definujte pojem gradient. Vypočítejte gradient funkce.
PA081 Programování numerických výpočtů
Rozhodněte o její pohyblivosti (určete počet stupňů volnosti).
PA081 Programování numerických výpočtů Přednáška 4.
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Přednáška 12 Diferenciální rovnice
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Lineární algebra.
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Základní číselné množiny
Získávání informací Získání informací o reálném systému
THÉVENINOVA VĚTA Příklad č. 1 - řešení.
Lineární rovnice Kvadratické rovnice Soustavy rovnic
RLC Obvody Michaela Šebestová.
TMF045 letní semestr 2005/2006 II Časová propagace vlnové funkce na mřížce I. (práce s momentovou reprezentací) (Lekce II)
F U N K C E.
MODEL DVOJBRANU - ADMITANČNÍ PARAMETRY
METODA KONEČNÝCH PRVKŮ
ANALÝZA VÝSLEDKŮ LINEÁRNÍHO OPTIMALIZAČNÍHO MODELU
A. Soustavy lineárních rovnic.
Regrese Aproximace metodou nejmenších čtverců
Funkce více proměnných.
FII-4 Elektrické pole Hlavní body Vztah mezi potenciálem a intenzitou Gradient Elektrické siločáry a ekvipotenciální plochy Pohyb.
Lineární regresní analýza
Odvození matice tuhosti izoparametrického trojúhelníkového prvku
Vektorová grafika.
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
Gradientní metody Metoda největšího spádu (volný extrém)
Optimalizace bez omezení (unconstraint)
Počítačová chemie (5. přednáška)
KVADRATICKÉ NEROVNICE
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
V experimentu měníme hodnotu jedné nebo několika veličin x i a studujeme závislost veličiny y. - např. měníme, ostatní x i bereme jako parametry ( , ,
Ryze kvadratická rovnice
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Poděkování: Tato experimentální úloha vznikla za podpory Evropského sociálního fondu v rámci realizace projektu: „Modernizace výukových postupů a zvýšení.
Aplikovaná statistika 2.
EMM21 Ekonomicko-matematické metody 2 Prof. RNDr. Jaroslav Ramík,CSc.
Základy zpracování geologických dat R. Čopjaková.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Interpolace funkčních závislostí
Cvičení V této kapitole můžete procvičit probrané téma. Jednotlivá cvičení obsahují správné řešení s postupem. Po zobrazení zadání se dalším(dalšími) kliknutím(kliknutími)
Kvantifikace množiny efektivních portfolií II
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
1 Lineární (vektorová) algebra
Funkce více proměnných.
Kvantifikace množiny efektivních portfolií II
Vektorová grafika.
4. Metoda nejmenších čtverců
Interpolace funkčních závislostí
Soustavy lineárních rovnic
Definiční obory. Množiny řešení. Intervaly.
MECHANIKA TUHÉHO TĚLESA
Pohyby v gravitačním poli jednoho tělesa
Transkript prezentace:

Minimalizace součtu čtverců - úvod Optimalizuje teoretický model tak, aby co nejvíce odpovídal naměřeným datům. => Minimalizuje odchylku modelu od naměřených hodnot. Využití: Všude, kde máme co do činění s analýzou nějakého přírodního nebo technického systému.

Minimalizace součtu čtverců - úvod II Naměřená data si můžeme představit jako dvojice: (ti, yi), i = 1, ..., m kde: ti Î Rk bod mìøení (napøíklad èas nebo místo mìøení nebo obojí) yi hodnota, namìøená v ti

Minimalizace součtu čtverců - úvod III Dále pak máme nìjaký matematický model M: Rk+n -> R, který je závislý na n volných parametrech x1, x2, ..., xn a pro který požadujeme, aby: M(ti, x) » yi kde: x = (x1, ..., xn) i = 1, ..., m (m je tedy počet naměřených bodů, se kterými budeme pracovat)

Minimalizace součtu čtverců - úvod IV V úlohách tohoto typu tedy pro m-prvkovou množinu naměřených bodů (ti, yi) hledáme parametry x1,..., xn modelu M tak, aby daný model co možná nejlépe popisoval tuto množinu. => Minimalizujeme odchylku modelu od naměřených dat.

Minimalizace součtu čtverců - příklad Ohmùv zákon Data: ((Ui), Ii) kde Ui je napìtí na svorkách rezistoru a Ii je proud, který prochází rezistorem Model: Obecně: M(ti, x) pro data (ti, yi) Konkrétně: Parametry modelu: x = (R), kde R je odpor rezistoru.

Minimalizace součtu čtverců - příklad II Radioaktivní rozpad Data: ((ti), Ni) kde ti je èas od poèátku mìøení a Ni je poèet atomù v èase ti Model: Obecně: M(ti, x) pro data (ti, yi) Konkrétně: Parametry modelu: x = (N0, T), kde N0 je poèet atomù v èase 0 a T je poloèas rozpadu.

Minimalizace součtu čtverců - příklad III Potenciální energie molekuly Data: ((s1,..., sn), Epot) kde s1, ..., sn jsou souřadnice jednotlivých atomů molekuly a Epot je potenciální energie molekuly Model: Obecně: M(ti, x) pro data (ti, yi) Konkrétně: Parametry modelu: je jich velmi mnoho – ideální vazebné vzdálenosti, vazebné úhly a torzní úhly, konstanty úměrnosti, atd ...

Minimalizace součtu čtverců - obecně Chceme minimalizovat odchylku modelu od naměřených dat => Chceme tedy, aby hodnoty rozdílù ri(x) = M(ti, x) - yi byly v absolutní hodnotì co nejmenší. To se dá interpretovat jako minimalizace normy vektoru: r(x) = (r1(x), ..., rm(x))T

Minimalizace součtu čtverců - obecně II Nejèastěji se používá euklidovská (L2) norma, pro kterou dostáváme minimalizovanou funkci ve tvaru: Namísto L2 normy je také možno použít normu L1 (souèet absolutních hodnot ri) nebo L¥ (maximum z absolutních hodnot ri). Tyto normy mají svoje opodstatnìní: napøíklad L1 norma lépe eliminuje body mìøení, které „uletìly“, tj. jsou výraznì mimo prùbìh zadaný ostatními body, èasto v dùsledku chyby pøi mìøení. V pøednáškách budeme dále pracovat pouze s Euklidovskou normou.

Minimalizace součtu čtverců - obecně III Na funkce typu: je možno přímo aplikovat minimalizační metody, probrané v předchozích kapitolách. Při výpočtech ale můžeme ušetřit mnoho času i paměti tím, že využijeme speciální vlastnosti tohoto problému :-).

Minimalizace součtu čtverců - obecně IV Gradient funkce f se dá vyjádøit jako: kde J(x) Î Rn´m je Jakobiho matice funkce f(x) (i-tý øádek matice J(x) je gradient ri v bodì x). Hessián funkce f se pak dá zapsat jako:

Minimalizace součtu čtverců - obecně V Pokud je model M v dobré shodì s daty, pak v minimu x* má funkce f velmi malou (kladnou) hodnotu. Pak tedy ri(x) jsou malá èísla a v okolí x* se proto dá zanedbat druhá suma ve vztahu: Hessián funkce f pak může být aproximován jako:

Minimalizace součtu čtverců - Gauss-Newtonovy metody Metody, které kombinují tuto aproximaci s Newtonovskými metodami se nazývají Gauss-Newtonovy metody. Klasický Newtonovský vztah pro výpočet směru přesunu (sk) z bodu xk do bodu xk+1: je tedy přeformulován na vztah:

Minimalizace součtu čtverců - Levenberg-Marquardtovy metody Použití dané aproximace v metodě s omezeným krokem dává Levenberg-Marquardtovu metodu pro součet čtverců. Původně byla Levenberg-Marquardtova metoda vyvinuta právě pro tuto aplikaci. Rovnice: kterou využívá Levenberg-Marquardtova metoda se v tomto speciálním případě přepisuje do tvaru:  

Minimalizace součtu čtverců - další metody Situace se komplikuje v případě, kdy neexistuje dostatečně dobré minimum funkce f, tj. když r(x) je nezanedbatelně velké pro všechna x. Pak je možné například kombinovat metodu BFGS a Gauss-Newtonovu metodu tímto způsobem: Podle velikosti relativního poklesu funkce f v k-té iteraci se hessián pro další iteraci aproximuje buď pomocí BFGS nebo pomocí Gauss-Newtonovy metody.

Minimalizace součtu čtverců - další metody II Pøesnìji øeèeno, pokud f(k) - f(k+1) ³ r.f(k) kde r Î (0, 1) je vhodì zvolený parametr, pak se pro odhad použije Gauss-Newtonova metoda, v opaèném pøípadì pak BFGS. Pro hodnotu r doporuèuje napø. Fletcher volit r = 0.2.

Lineární úloha nejmenších čtverců - úvod V tomto případě je model lineární vzhledem k aproximovaným parametrùm: M(ti, x) = f1(ti).x1 + ... + fn(ti).xn Pro odchylku modelu od reálného výsledku měření platí: => ri(x) = M(ti, x) - yi = f1(ti).x1 + ... + fn(ti).xn - yi Funkce, kterou budeme v rámci metody minimalizovat, má tedy tvar:

Lineární úloha nejmenších čtverců - úvod II Budeme tedy minimalizovat funkci: V minimu musí pro všechny parametry x1, ..., xn modelu platit: Po odderivování tedy platí:

Lineární úloha nejmenších čtverců - úvod III Rovnici: budeme dále upravovat: Soustavu rovnice v tomto tvaru můžeme zapsat pomocí matice: A.x = b

Lineární úloha nejmenších čtverců - úvod IV Soustavu rovnic: lze zapsat ve tvaru A.x = b následovně: kde k, j Î{1, …, n} Můžeme tedy obejít náročný proces minimalizace a získat minimum přímo řešením této soustavy.

Lineární úloha nejmenších čtverců - příklad Chceme řešit tento problém: Mějme objekt, pohybující se v čase t rychlostí v. Naměřili jsme, že objekt se v čase t1 = 1s pohyboval rychlostí v1 = 1 m/s t2 = 2s pohyboval rychlostí v2 = 6 m/s t3 = 3s pohyboval rychlostí v3 = 2 m/s Pohyb tohoto objektu považujeme za rovnoměrně zrychlený a můžeme ho tedy modelovat pomocí vztahu: v = a.t + v0, kde: a zrychlení objektu v0 počáteční rychlost objektu Úkolem je určit parametry a a v0.

Lineární úloha nejmenších čtverců - příklad II Obecný vztah pro model: M(ti, x) = f1(ti).x1 + ... + fn(ti).xn můžeme tedy v našem případě přepsat do tvaru: M(ti, (a, v0)) = f1(ti).a + f2(ti).v0 = a.t + v0 => n = 2 Pro f1 a f2 tedy platí: f1(ti) = ti f2(ti) = 1

Lineární úloha nejmenších čtverců - příklad III Měřením jsme získali 3 body: (1, 1); (2, 6) a (3, 2) (=> m = 3) Problém lze obecně zapsat pomocí soustavy n rovnic A.x = b kde k, j Î{1, …, n} V našem případě tedy bude platit: a11 = t1. t1 + t2. t2 + t3. t3 = 14 a12 = t1 + t2 + t3 = 6 a21 = t1 + t2 + t3 = 6 a22 = 1 + 1 + 1 = 3 b1 = y1. t1 + y2. t2 + y3. t3 = 19 b2 = y1 + y2 + y3 = 9 x1 = a x2 = v0

Lineární úloha nejmenších čtverců - příklad IV Budeme tedy řešit soustavu rovnic: Řešení: a = 0.5 m/s2 v0 = 2 m/s Součet čtverců odchylek:

Lineární úloha nejmenších čtverců - příklad V Grafické znázornění výsledku:

Lineární úloha nejmenších čtverců - úlohy se dvěma parametry S tímto typem úloh se setkáváme v praxi velmi často, jedná se o úlohy typu: Máte zadáno m bodů (ti, yi), proložte těmito body přímku. = nalezněte koeficienty k a q v rovnici y = k.t + q. V tomto případě lze obecnou soustavu rovnic A.x = b kde k, j Î{1, …, n} Pøepsat do tvaru:

Lineární úloha nejmenších čtverců - úlohy se dvěma parametry II Řešením této soustavy: Pak získáme pro k a q vztahy:

Lineární úloha nejmenších čtverců - úlohy se dvěma parametry III Příklad: Zadání stejné jako u předchozího příkladu o „objektu, pohybujícím se v čase t rychlostí v“. Máme tedy body: (1, 1); (2, 6) a (3, 2) a chceme jimi proložit přímku: v = a.t + v0 Konkrétní výpočet:

Kvadratická úloha nejmenších čtverců - úloha se třemi parametry Naměřenými body tedy chceme proložit rovnici: y = a.t2 + b.t + c Analogicky jako v lineárním případě lze i v kvadratickém případě tuto speciální úlohu zapsat pomocí soustavy rovnic A.x = b, a to následovně:

Kvadratická úloha nejmenších čtverců - úloha se třemi parametry II Metodou nejmenších čtverců najděte polynom 2.stupně, který je nejblíže bodům: [1,1], [2,3], [4,6]. Řešíme tedy soustavu rovnic:

Kvadratická úloha nejmenších čtverců - úloha se třemi parametry III => soustava: 273a + 73b + 21c = 109 73a + 21b + 7c = 31 21a + 7b + 3c = 10 Výsledek je: a = -1/6, b = 5/2, c = -4/3.

Cvičení - příklad 1 Metodou nejmenších čtverců najděte přímku, která je nejblíže bodům: (1,1); (2,6) a (3,2) Použijte „přímý přístup“ - vytvořit funkci, odderivovat, derivaci položit rovnu nule, dořešit :-). Řešení: Hledáme přímku ve tvaru y = kx + q Minimalizovaná funkce:

Cvičení - příklad 1 II Derivace: Řešíme tedy a Minimum je v bodě k = 0.5 a q = 2

Cvičení - příklad 2 Metodou nejmenších čtverců najděte přímku, která je nejblíže bodům: (1, 2); (2, 2.3) a (3, 3) Vytvořte soustavu rovnic A.x = b a vyřešte ji, obecně: kde k, j Î{1, …, n} Soustava: a11 = 14 a12 = 6 a21 = 6 a22 = 3 b1 = 15,6 b2 = 7,3 Řešení: k = 0,5 q = 1,43

Cvičení - příklad 3 Metodou nejmenších čtverců najděte přímku, která je nejblíže bodům: (-2,0); (0,1) a (2,3) Využijte vztahy:

Cvičení - příklad 4 Metodou nejmenších čtverců najděte polynom 2.stupně, který je nejblíže bodům: [1,2], [2,0], [3,3], [4,4]. Řešení: Opět hledáme polynom ve tvaru Tedy řešíme soustavu rovnic:

Cvičení - příklad 4 II => soustava: 354a + 100b + 30c = 93 Výsledek je: a = 3/4, b = -57/20, c = 15/4.