8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Statistická indukce Teorie odhadu.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Statistická indukce Teorie odhadu.
Výpočet zásoby porostu na zkusných plochách při požadované přesnosti
UKAZATELE ZPŮSOBILOSTI A VÝKONNOSTI
Testování parametrických hypotéz
Statistika (D360P03Z) akademický rok 2004/2005
Testování statistických hypotéz
Limitní věty.
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Diskrétní rozdělení a jejich použití
t-rozdělení, jeho použití
Získávání informací Získání informací o reálném systému
Pravděpodobnost a statistika opakování základních pojmů
CHYBY MĚŘENÍ.
Generování náhodných veličin (1) Diskrétní rozdělení
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
Obsah statistiky Jana Zvárová
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
také Gaussovo rozdělení (normal or Gaussian distribution)
Odhady parametrů základního souboru
Nechť (, , P) je pravděpodobnostní prostor:
Odhady odhady bodové a intervalové odhady
Diskrétní rozdělení Karel Zvára 1.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Data s diskrétním rozdělením
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Generování náhodných veličin Diskrétní a spojitá rozdělení Simulační modely ek.procesů 4.přednáška.
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Pohled z ptačí perspektivy
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Pravděpodobnost.
2. Vybrané základní pojmy matematické statistiky
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Jak statistika dokazuje závislost
Statistické odhady (inference) Výběr Nepotřebujeme sníst celého vola jenom proto, abychom poznali, že to jde ztuha. Samuel Johnson (anglický básník a.
Aritmetický průměr - střední hodnota
Inferenční statistika - úvod
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Odhady odhady bodové a intervalové odhady
Některá rozdělení náhodných veličin
Základy statistické indukce
Induktivní statistika
Induktivní statistika
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Induktivní statistika
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
příklad: hody hrací kostkou
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením se střední hodnotou  a rozptylem  2 – náhodný výběr z onoho rozdělení pro průměr z těchto veličin platí průměr má tedy rozptyl n-krát menší, než jednotlivá pozorování střední chyba průměru = směrodatná odchylka průměru

8. listopadu 2004Statistika (D360P03Z) 6. předn.2 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s rozdělením N( ,  2 ) – náhodný výběr z N( ,  2 ) pro průměr z těchto veličin platí střední chyba průměru = směrodatná odchylka průměru proto

8. listopadu 2004Statistika (D360P03Z) 6. předn.3 příklad: věk matek veliká populace rodičů (11 tisíc)

8. listopadu 2004Statistika (D360P03Z) 6. předn.4 příklad: věk matek vybráno 100 matek

8. listopadu 2004Statistika (D360P03Z) 6. předn.5 příklad: věk matek vybráno 100 krát n=10 matek, průměry:

8. listopadu 2004Statistika (D360P03Z) 6. předn.6 příklad: věk matek vybráno 100 krát n=100 matek, průměry:

8. listopadu 2004Statistika (D360P03Z) 6. předn.7 příklad: věk matek veliká populace rodičů (11 tisíc) náhodně vybráno 100 matek (vlastně průměry výběrů rozsahu n = 1), histogram 100 krát náhodně vybráno vždy n = 10 matek, spočítán průměr, histogram průměrů 100 krát náhodně vybráno vždy n = 100 matek, spočítán průměr, histogram průměrů očekáváme, že každý následující rozptyl ze 100 hodnot (průměrů) bude asi 10 krát menší skutečnost: 18,9; 1,9, 0,2

8. listopadu 2004Statistika (D360P03Z) 6. předn.8 příklad: věk matek (shodné měřítko)

8. listopadu 2004Statistika (D360P03Z) 6. předn.9 centrální limitní věta nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny se stejným rozdělením, se střední hodnotou  a rozptylem  2 >0. Potom pro velké n má průměr z nich rozdělení N( ,  2 /n). prakticky: pro dost velká n má průměr normální rozdělení příklad: průměrný věk matek z velkých výběrů už (téměř) normální rozdělení

8. listopadu 2004Statistika (D360P03Z) 6. předn.10 příklad: věk matek

8. listopadu 2004Statistika (D360P03Z) 6. předn.11 interval spolehlivosti (1) pro X ~ N( ,  2 ) platí P(|X -  | < 1,96  ) = 0,95 tj. 95 % protože je ~ N( ,  2 /n), platí, tedy dostali jsme 95% interval spolehlivosti

8. listopadu 2004Statistika (D360P03Z) 6. předn.12 interval spolehlivosti (2) 95% interval spolehlivosti překryje s pravděpodobností 95 % neznámé  kdybychom postup prováděli opakovaně, pak asi v 95 % případů překryjeme skutečnou hodnotu , ve zbylých asi 5 % zůstane skutečné  mimo interval spol. pro velké n lze  nahradit pomocí s x pro obecné  :

8. listopadu 2004Statistika (D360P03Z) 6. předn.13 interval spolehlivosti (3) pro malé n (do ~ 50 i více) a X i s normálním rozdělením raději použít kritické hodnoty Studentova t-rozdělení: interval spolehlivosti se počítá i pro jiné parametry, vždy interval, který s požadovanou pravděpodobností překryje odhadovaný parametr = intervalový odhad

8. listopadu 2004Statistika (D360P03Z) 6. předn.14 příklad: věk matek 95% interval pro populační průměr věku všech matek na základě výběru 99 matek 99% interval pro populační průměr věku všech matek na základě výběru 99 matek bude užší nebo širší? větší jistota  větší šířka

8. listopadu 2004Statistika (D360P03Z) 6. předn.15 příklad: věk matky, výběry n = 100 celkem % intervalů spol. pro  (=25,4), 7 nepřekrylo

8. listopadu 2004Statistika (D360P03Z) 6. předn.16 centrální limitní věta pro četnosti Nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny se stejným rozdělením, se střední hodnotou  a rozptylem  2 >0. Potom pro velké n má průměr z nich rozdělení N( ,  2 /n). absolutní četnost Y součet veličin s alternativním rozdělením Y ~ bi(n,  ), přibližně Y ~N(n , n  (1-  )) relativní četnost f = Y / n f - průměr veličin s alternativním rozdělením f ~ N( ,  (1-  )/n)

8. listopadu 2004Statistika (D360P03Z) 6. předn.17 interval spolehlivosti pro podíl (1) populace: podíl  prvků s danou vlastností je to pravděpodobnost, že vlastnost má náhodně vybraný prvek výběr: relativní četnost ve výběru relativní četnost je průměr nula-jedničkové veličiny – pro velké n má přibližně normální rozdělení nula-jedničková veličina má rozptyl  (1-  ) relativní četnost (=průměr) má rozptyl

8. listopadu 2004Statistika (D360P03Z) 6. předn.18 interval spolehlivosti pro podíl (2) střední chyba relativní četnosti je odmocnina z jejího rozptylu, je tedy pravděpodobnost  neznáme, odhadneme pomocí relativní četnosti f odtud 95% interval spolehlivosti pro  existuje přesnější (pracnější) metoda

8. listopadu 2004Statistika (D360P03Z) 6. předn.19 příklad: hody hrací kostkou odhadujeme pravděpodobnost šestky kostka A: n = 100, n A = 17, f A = 0,17 kostka B: n = 100, n B = 41, f B = 0,41 důležitý rozdíl: v prvním případě patří 1/6=0,167 do intervalu spolehlivosti, ve druhém případě nikoliv

8. listopadu 2004Statistika (D360P03Z) 6. předn.20 proč testování hypotéz nelze bezpečně poznat, že kostka B je falešná nebo že kostka A není falešná intervaly spolehlivosti vymezily rozmezí, kde by skutečná pravděpodobnost šestky měla být, jejich spolehlivost je velká, ale omezená znamená něco, když 1/6 neleží v 95% intervalu spolehlivosti? musíme připustit, že jsme mohli mít smůlu, že se v našich pokusech náhodou realizovaly málo pravděpodobné možnosti, přestože k takové smůle dochází jen zřídka