TEORETICKÉ MODELY některých DISKRÉTNÍCH NV

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

VÝPOČET OC.
Statistická indukce Teorie odhadu.
Vybraná rozdělení diskrétní náhodné veličiny
Limitní věty.
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Diskrétní rozdělení a jejich použití
Pravděpodobnost a statistika opakování základních pojmů
Generování náhodných veličin (1) Diskrétní rozdělení
Obsah prezentace Náhodná proměnná Rozdělení náhodné proměnné.
Náhodná veličina.
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
Obsah statistiky Jana Zvárová
Náhodná proměnná Rozdělení.
Příklad přejímací kontroly A Příklad uvádí, jak ovlivní střední hodnota a směrodatná odchylka pravděpodobnost chyby (vadného výrobku). Ptáme se, kolik.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Vybraná rozdělení spojité náhodné veličiny
Odhady parametrů základního souboru
Pravděpodobnost 10 Binomické rozdělení pravděpodobnosti neboli
Nechť (, , P) je pravděpodobnostní prostor:
Aplikovaná statistika
Některá diskrétní a spojitá rozdělení náhodné veličiny.
Diskrétní rozdělení Karel Zvára 1.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Data s diskrétním rozdělením
POČET PRAVDĚPODOBNOSTI
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Generování náhodných veličin Diskrétní a spojitá rozdělení Simulační modely ek.procesů 4.přednáška.
Definice stochastického procesu jako funkce 2 proměnných
Vybraná rozdělení spojité náhodné veličiny
Základy statistické indukce Základní soubor, náhodný výběr Základní statistický soubor (stručněji základní soubor) je statistický soubor, z něhož pořizujeme.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
Rozdělení diskrétních veličin. Příklady diskrétních náhodných veličin Pokus jev nastaljev nenastal pnS hod mincírublíc1/2počet hodůpočet rubů celkem narození.
Základy zpracování geologických dat
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
MATEMATICKÁ STATISTIKA
2. Vybrané základní pojmy matematické statistiky
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Normální rozdělení a ověření normality dat
(Popis náhodné veličiny)
Poissonovo rozdělení diskrétní náhodné veličiny
Inferenční statistika - úvod
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Etapy stat.šetření Plán šetření Sběr dat
Některá rozdělení náhodných veličin
Spojitá náhodná veličina
Základy statistické indukce
Induktivní statistika
- váhy jednotlivých studií
Odhady parametrů základního souboru
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Spojitá a kategoriální data Základní popisné statistiky
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Statistika a výpočetní technika
Rozdělení pravděpodobnosti
Poissonovo rozdělení diskrétní náhodné veličiny
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Transkript prezentace:

TEORETICKÉ MODELY některých DISKRÉTNÍCH NV Veličiny, kterými se biolog, lékař, zemědělec, historik, … zabývá, bývají nejrůznější povahy. Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti. Typové modely takových rozdělení byly stanoveny teoreticky jako zákony rozdělení a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně. Snažíme se o nalezení teoretického rozdělení a jeho parametrů tak, aby co nejlépe vystihovalo empirické rozdělení četností. Jinými slovy: Hledáme co nejjednodušší „model“, který odpovídá našim reálným datům.

Rovnoměrné diskrétní rozdělení Náhodná veličina má rovnoměrné diskrétní rozdělení, jestliže k - hodnot, kterých může nabývat, se vyskytuje s pravděpodobností Rozdělení je modelem pokusů házení mincí (k=2) nebo házení hrací kostkou (k=6) Střední hodnota je a rozptyl je var(X)=E[X-E(X)]2 = E(X2) - [E(X)]2

Příklad: Rovnoměrné diskrétní rozdělení - hod kostkou

Alternativní (Bernoulliho) rozdělení je zvláštním případem Binomického rozdělení (viz dále) a nazývá se Alternativní neboli Bernoulliho rozdělení. Alternativní veličina – indikátor nemoci, symptomu, … . NV může nabývat pouze hodnoty 1 s pravděpodobností p nebo hodnoty 0 s pravděpodobností (1-p) Střední hodnota E(X) = p Rozptyl var(X) = p(1-p) PŘ1: počet lvů při hodu 1 mincí - buď padne 1 lev nebo žádný, p = 0,5 PŘ2: riziko onemocnění, pravděpodobnost výhry, ... Kde a … počet pozitivních odpovědí (nemocných, losů, které vyhrávají). b … počet negativních odpovědí (počet zdravých, losů bez výhry)

Binomické rozdělení Bi (n; π) Toto rozdělení má náhodná veličina X, která vznikne jako součet n nezávislých alternativně rozdělených náhodných veličin se stejným parametrem π (pravděpodobnost úspěchu). Diskrétní náhodná veličina X má binomické rozdělení s parametry n, π, π Є (0, 1), resp. nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností Střední hodnota: Rozptyl:

Binomické rozdělení Bi (n; π) Příklad: Hokejisté mají proměnit 5 trestných střílení. Jsou vybráni hráči, u nichž pravděpodobnost vstřelení branky je 0,8. Jaká je pravděpodobnost, že vstřelí branku ze všech pěti pokusů? Z definice pravděpodobnosti plyne: p = 0,8*0,8*0,8*0,8*0,8 Jaká by byla pravděpodobnost, že vstřelí branku jen ve třech stříleních? Z definice pravděpodobnosti: p = počet možností * (0,8)3 * (0,2)2 Binomické rozdělení: Binomické rozdělení je rozdělením nezávislých pokusů alternativní veličiny se stejnou pravděpodobností úspěchu.

Binomické rozdělení Bi (n; π) Máme alternativní veličinu např. indikující, zda daná osoba trpí diabetem s pravděpodobností p = π a osoba je zdravá s pravděp ... ností p = 1 - π Předpoklady: všechny osoby mají stejnou pravděpodobnost výskytu onemocnění výskyt diabetes je u jednotlivých osob nezávislý (nejedná se o nakažlivou chorobu) Sledovaná populace: n osob Ve výběru bude: x nemocných Pravděpodobnost, že X = x

Binomické rozdělení X … náhodná veličina x … hodnota NV, které dosáhne (např. pro 30 měření 0, 1, 2, …, 30) π … pravděpodobnost, s jakou je jev pozorován 1-π … pravděpodobnost, s jakou jev nenastane

Poissonovo rozdělení U předchozího binomického rozdělení jsme sledovali soubor konečného, často malého rozsahu. Ale často se stává, že sledovaná populace může být velmi rozsáhlá nebo dokonce „nekonečná“ (např. sledujeme počet infekcí horních cest dýchacích u dětí během prvních tří let věku). Parametr n v tomto případě neznáme a rozdělení veličiny můžeme popsat vzorcem , kde λ je jediným parametrem tohoto rozdělení. Vyjadřuje pravděpodobnost, že ve výběru bude x nemocných a nazývá se Poissonovo rozdělení.

Poissonovo rozdělení Diskrétní náhodná veličina X má Poissonovo rozdělení s parametrem λ > 0, nabývá-li hodnot x = 0, 1, 2, … s pravděpodobností Základní charakteristiky střední hodnota a rozptyl: Distribuční funkce (kumulativní pravděpodobnosti): Poissonovo rozdělení je rozdělením řídkých jevů. Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Poissonovo rozdělení Spolu s Binomickým rozdělením se používá nejčastěji pro popis veličin, které vyjadřují počet nalezených objektů našeho zájmu: - počet hovorů za jednotku času v telefonní ústředně - počet vadných výrobků - počet kazů na látce - počet částic v jednotce objemu Pro velká n a malá p lze Binomické rozdělení aproximovat Poissonovým rozdělením Po (λ = np) Vztah platí i opačně – Poissonovo rozdělení můžeme aproximovat Binomickým: - zvolíme dostatečně velké n (řádově 100 – 1000 x větší než λ) a p vypočteme jako p = λ/n Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Poissonovo rozdělení Př. Sledujeme počet infekcí horních dýchacích cest dětí během prvních tří let jejich věku ve velmi rozsáhlé populaci a z těchto sledování stanovíme pravděpodobnost tohoto onemocnění a označíme ji λ. Pravděpodobnost, že ve výběru bude x nemocných, vypočteme pomocí Poissonova rozdělení za předpokladů: všechny děti mají stejnou pravděpodobnost onemocnění výskyt onemocnění je u jednotlivých osob nezávislý

Poissonovo rozdělení Očekávaná hodnota (lambda) byla podle propočtů Německý statistik Borkiewicz sledoval po dobu 10 let ve 20-ti německých armádních sborech zabití vojenských osob úderem koňského kopyta Očekávaná hodnota (lambda) byla podle propočtů počet mrtvých / počet sledování 122 / 200 = 0,61 Skutečnost Propočet 0 mrtvých 109 1 mrtvý 65 66 2 mrtví 22 20 3 mrtví 3 4 4 mrtví 1 0,6

Vypočtený počet vojenských sborů Porovnání se skutečným sledováním Poissonovo rozložení - smrt po úderu koňským kopytem Počet úmrtí   Vypočtený počet vojenských sborů Porovnání se skutečným sledováním POWER(0,61;A2)/FAKTORIÁL(A2)*EXP(-0,61) 0,543 108,7 109 1 0,331 66,3 65 2 0,101 20,2 22 3 0,0205 4,1 4 0,0031 0,6 5 0,00038 0,1 6 3,88801E-05 0,0

Poissonovo rozložení - smrt po úderu koňským kopytem Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek MODŘE - skutečnost ŠEDĚ – propočet

Frekvenční funkce Poissonova rozložení v závislosti na λ

Poissonovo rozdělení - příklad Příklad: Do podnikové telefonní ústředny přichází v průměru 120 hovorů za hodinu. Vypočtěte, jaká je pravděpodobnost: a) že za půl minuty nepřijde hovor b) že přijde méně než tři hovory Řešení: 120 hovorů za hodinu znamená 1 hovor za půl minuty: λ = 1 Jedná se o řídký náhodný jev, proto ho můžeme modelovat Poissonovým rozdělením. Pro hledaný časový interval půl minuty, tj, λ=1 se vzorec zjednoduší na Pro X=0 je Pro X=1 je Pro X=2 je a) P(X=0) = 0,368 b) P(X<3) = 0,368+0,368+0,184 = 0,92 Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Multinomické rozdělení Příklad: sledujeme nominální veličinu rodinný stav matky svobodná, vdaná, rozvedená, vdova Pravděpodobnost, že z n – matek bude právě k1 svobodných, k2 vdaných, k3 rozvedených a k4 vdov vyjadřuje vzorec: P(X1=k1, X2=k2, X3=k3, X4=k4) =

Hypergeometrické rozdělení H(M,N,n) Mějme: N předmětů, z toho M předmětů jednoho druhu N - M předmětů druhého druhu Vylosujeme n předmětů bez vracení, kde je x - předmětů prvního druhu, např. x = 0 znamená, že 1. druh nebyl tažen. Sledujeme počet úspěchů x v n - závislých pokusech Ne všechny situace jsou možné, musíme stanovit podmínky. Příklad 1: Z osudí, ve kterém je N kuliček, z toho M bílých, vybíráme náhodně n jednotek a ptáme se, kolik je mezi nimi bílých kuliček. (Losovat můžeme postupně, ale důležité je, že kuličky zpět nevracíme). Příklad 2: Losování sportky Předměty prvního druhu jsou označeny veřejným losováním ve hře sportka. Výběrem čísel na tiketu jsme losovali právě tyto předměty prvního druhu.

Hypergeometrické rozdělení H(M,N,n) Diskrétní náhodná veličina X má hypergeometrické rozdělení s parametry M, N, n, kde M, N, n jsou přirozená čísla a n Є (0, M), nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností Základní charakteristiky: Střední hodnota: Rozptyl:

Hypergeometrické rozdělení H(M,N,n) Je-li rozsah výběru n oproti počtu jednotek v osudí N malý (provedeme-li třeba jen 10%-ní výběr), pak se hodnota výrazu ze vzorce pro rozptyl blíží 1. označíme jako p a hypergeometrické rozdělení lze aproximovat Binomickým rozdělením s rozptylem