Odhad metodou maximální věrohodnost

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistická indukce Teorie odhadu.
Testování parametrických hypotéz
Testování statistických hypotéz
Limitní věty.
Geometrický parametr reaktoru různého tvaru
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
Diskrétní rozdělení a jejich použití
t-rozdělení, jeho použití
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Odhad genetických parametrů
Pravděpodobnost a statistika opakování základních pojmů
Testování hypotéz přednáška.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Náhodná proměnná Rozdělení.
Základy ekonometrie Cvičení září 2010.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
Odhady parametrů základního souboru
Základy ekonometrie Cvičení 3 4. října 2010.
Nechť (, , P) je pravděpodobnostní prostor:
Některá diskrétní a spojitá rozdělení náhodné veličiny.
Diskrétní rozdělení Karel Zvára 1.
Data s diskrétním rozdělením
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regresní analýza
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Princip maximální entropie
Experimentální fyzika I. 2
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Normální rozdělení a ověření normality dat
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
(Popis náhodné veličiny)
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Aritmetický průměr - střední hodnota
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Inferenční statistika - úvod
Jiří Šafr jiri.safr(zavináč)seznam.cz
Klasifikace a rozpoznávání Lineární klasifikátory.
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Induktivní statistika
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
Úvod do praktické fyziky
Odhady parametrů základního souboru
Induktivní statistika
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Klasifikace a rozpoznávání
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
Neparametrické testy pro porovnání polohy
ANALÝZA A KLASIFIKACE DAT
Lineární regrese.
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

Odhad metodou maximální věrohodnost J.Hendl

Odhad metodou maximální věrohodnost Podmíněné rozložení a věrohodnost Odhad metodou maximální věrohodnosti Test poměrem věrohodností

Chceme znát vlastnosti této funkce t. Úvod Chceme odhadnout parametry, provedeme měření a získáme tak informace o sledovaném rozložení (x1,…,xn). Metoda maximalizace věrohodnost je jednou z metod odhadu, mezi ně patří také metoda nejmenších čtverců, metoda momentů, bayesovská metoda atd. Výsledkem je funkce pozorování – t(x1,…,xn). Jedná se tedy o náhodnou proměnnou. Chceme znát vlastnosti této funkce t.

Požadované vlastnosti Nestrannost. Vychýlení (Bias) je definováno jako průměrný rozdíl mezi odhadem (t) a správnou hodnotou parametru (). Efficience. Má malý rozptyl (var(t)). Konsistence. Jak se n blíží k nekonečnu, odhad t se blíží ke správné hodnotě . Minimální průměrná kvadratická odchylka: očekávaná hodnota čtverce odchylek. Odhad má být eficientní a nestranný. Je těžké dosáhnout všech těchto vlastností. ML odhady mají dobré asymptotické vlastnosti. Například t je asymptoticky normální.

Podmíněné rozložení resp. pravděpodobnost, věrohodnostní funkce Známe tvar rozložení, které závisí na parametru (parametrech) . Jedno pozorování má hustotu f(x|). Jedná se podmíněné rozložení f(x|), za podmínky že známe parametr  . Pro nezávislá pozorování je společné rozložení násobkem jednotlivých hustot nebo pravděpodobnostních funkcí: Můžeme interpretovat f(x1,x2,,,xn|) jako pravděpodobnost dané konfigurace pozorování, jestliže známe parametr . Věrohodnostní funkce je úměrná společnému rozložení:

Podmíněně rozložení a věrohodnost (pokr.) Když mluvíme o rozložení, považujeme parametr za fixní a pozorování se mění. Jestliže mluvíme o věrohodnosti, pak jsou pozorování fixní a parametr se může měnit : Princip maximální věrohodnosti říká, že máme zvolit jako odhad parametr, který maximalizuje věrohodnost toho, že napozorujeme danou konfiguraci pozorování:

Metoda maximální věrohodnosti (Maximum likelihood) Jestliže maximalizujeme funkci, která ma derivaci, pak lze derivaci položit rovnou nule: Řešení této rovnice dává kandidáty na odhad. Místo věrohodnostní funkce často derivujeme logaritmus věrohodnostní funkce, protože ten je rostoucí funkcí a nic se v podstatě nemění: Práce se součtem je výhodnější než s násobky.

Maximum likelihood: příklad – úspěch a neúspěch Uvažujme případ diskrétního rozložení. Provádíme pokus na úspěch a neúspěch, pravděpodobnost úspěchu je  a pravděpodobnost neúspěchu je 1- . Neznámá hodnota . Provedli jsme n pokusů, k z nich bylo úspěšných k a n-k neúspěšných. Náhodná proměnná Y má hodnoty - 0 (neúspěch) nebo - 1 (úspěch).

Maximum likelihood: příklad – úspěch a neúspěch Uvažujme případ diskrétního rozložení. Pozorování jsou y=(y1,y2,…,yn). Pravděpodobnost úspěchu yi v i-tém pokusu: Jelikož pokusy jsou nezávislé ze pro n pokusů psát:

Maximum likelihood: příklad – úspěch a neúspěch (pokr.) Pro log této funkce lze psát: Po derivaci podle parametru a položením rovno nule dostaneme: Vyřešením vzniklé rovnice získáme odhad ve formě:

Maximum likelihood: příklad – úspěch a neúspěch Zajímavější je situace, jestliže  je funkcí nějakých parametrů: máme např.: Nalezení maxima věrohodnostní funkce je pak složitější a musí se hledat iterativně, jedná se o nelineární optimalizaci funkce ve tvaru: To je případ logistické regrese

Pro normální rozložení hledáme odhady parametrů (spojité rozložení) Věrohodnostní funkce má tvar pro n pozorování y=(y1,y2,,,yn), jestliže logaritmujeme: Derivujeme parciálně podle průměru a směrodatné odchylky: První lze získat nezávisle na druhém řešení:

Test poměrem maximální věrohodnosti Předpokládejme výběr o rozsahu n (x=(x1,,,,xn)) a chceme odhadnout vektor parametrů =( 1,2). Obě části jsou vektory 1 a 2 . Testujeme nulovou hypotézu proti alternativě: Předpokládejme, že věrohodnostní funkce má tvar L(x| ). Pak test sestrojíme takto: 1) Maximalizujeme věrohodnostní funkci za platnosti nulové hypotézy 10 , 2) Maximalizujeme věrohodnostní funkci bez omezení: w je testovací statistika. Jestliže je malá hypotézu zamítáme.