Diskrétní rozdělení a jejich použití

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

Statistická indukce Teorie odhadu.
Limitní věty.
Odhady parametrů základního souboru
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Analýza variance (Analysis of variance)
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
t-rozdělení, jeho použití
Pravděpodobnost a statistika opakování základních pojmů
Generování náhodných veličin (1) Diskrétní rozdělení
Obsah prezentace Náhodná proměnná Rozdělení náhodné proměnné.
Náhodná proměnná Rozdělení.
Binomická distribuce Při zjišťování p je nutné znát:  a) celkový počet možných jednoduchých jevů  b) počet jednoduchých jevů který spadá do jevu/třídy.
také Gaussovo rozdělení (normal or Gaussian distribution)
Obecný lineární model Analýza kovariance Nelineární modely
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Některá diskrétní a spojitá rozdělení náhodné veličiny.
Odhady odhady bodové a intervalové odhady
Analýza prostorového rozmístění populace (spatial pattern analysis) a co z ní můžeme zjistit – i pro mechanismy.
Diskrétní rozdělení Karel Zvára 1.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Data s diskrétním rozdělením
Generování náhodných veličin Diskrétní a spojitá rozdělení Simulační modely ek.procesů 4.přednáška.
Vybraná rozdělení spojité náhodné veličiny
Lineární regrese.
Závislost dvou kvantitativních proměnných
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
Rozdělení diskrétních veličin. Příklady diskrétních náhodných veličin Pokus jev nastaljev nenastal pnS hod mincírublíc1/2počet hodůpočet rubů celkem narození.
Pohled z ptačí perspektivy
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
2. Vybrané základní pojmy matematické statistiky
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
(Popis náhodné veličiny)
Poissonovo rozdělení diskrétní náhodné veličiny
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Aritmetický průměr - střední hodnota
Inferenční statistika - úvod
IV..
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Odhady odhady bodové a intervalové odhady
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Stručný přehled modelových rozložení I.
Některá rozdělení náhodných veličin
Spojitá náhodná veličina
Základy statistické indukce
Induktivní statistika
Induktivní statistika
Induktivní statistika
Induktivní statistika
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Spojitá a kategoriální data Základní popisné statistiky
Analýza kardinálních proměnných
Rozdělení pravděpodobnosti
Pokročilé neparametrické metody Validační techniky
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Princip max. věrohodnosti - odhad parametrů
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Transkript prezentace:

Diskrétní rozdělení a jejich použití Poissonovo a binomické rozdělení

Diskrétní rozdělení Mohou nabývat pouze určitých hodnot Nejčastější jsou ty, co mohou nabývat pouze celočíselných hodnot Nejběžnější jsou Poissonovo a binomické Další běžná jsou negativně binomické a Neymannovo (A a B)

Poissonovo rozdělení

Poissonovo rozdělení Model: Mám velmi mnoho hrníčků, a mnohokrát házím kuličkou. Každým hodem se do nějakého hrníčku trefím. Každý hod je nezávislý na předchozích (tzn., že přítomnost kuličky v hrníčku neovlivní, zda se do něj znovu trefím). Počet kuliček v hrnečku bude potom mít Poissonovskou distribuci. Její jediný parametr, λ, je poměrem celkového počtu kuliček k počtu hrníčků (a tedy průměrným počtem kuliček v hrníčku).

Poissonovo rozdělení

Poissonovo rozdělení Střední hodnota i variance rozdělení = λ

Rozdělení je vždy pozitivně šikmé, nicméně čím větší λ, tím menší šikmost. Při velkém λ se rozdělení blíží normálnímu

Na co se používá Poissonovská proměnná jako odpověď (v ANOVě, regresi): Buď použiji Zobecněné lineární modely (mají Poissonovskou distribuci jako jednu z možností) Nebo provedu odmocninovou transformaci Ta by měla rozdělení zesymetričtit a zároveň stabilizovat varianci

Zjišťování náhodnosti ve spojitém prostoru (třeba hořce na louce) si musíme vymyslet zkusné jednotky nebo v diskrétních jednotkách (pro parazity na kapru nebo počet rekombinačních nodů na chromozomu)

Poissonovo rozdělení: zjišťování náhodnosti rozmístění Jsou květenství rozmístěna náhodně? Umístím přes plochu čtverce (náhodně na část nebo pravidelnou síť) Spočítám průměr a varianci: pro náhodné rozmístění budou mít počty ve čtvercích Poissonovo rozdělení, průměr rovný varianci

Pokud jsou individual rozmístěna náhodně Počty individuí v náhodně umístěných čtvercích mají Poissonovo rozdělení - tedy Pokud v jednotce najdu jedno individuum, nemění se pravděpodobnost, že najdu další

Pokud jsou individual rozmístěna shlukovitě Počty individuí v náhodně umístěných čtvercích mají Pokud v jednotce najdu jedno individuum, zvyšuje to pravděpodobnost, že najdu další POZOR – záleží na velikosti čtverce Hříbky rostou shlukovitě, a proto když najdu, hledám “bratříčka”

Pokud je tendence k pravidelnosti či úplná pravidelnost Pokud v jednotce najdu jedno individuum, snižuje to pravděpodobnost, že najdu další

Poměr (pro počet individuí) je pak považován za charakteristiku rozmístění individuí Populární je i Lloydův index - ten se nemění, pokud individua náhodně vymírají

Odchylku od náhodnosti lze testovat: 1. Klasický test shody s Poissonovým rozdělením 2. má přibližně 2 rozdělení s n-1 stupni volnosti v případě, že se jedná o Poissonovo rozdělení.

Řada metod pro popis rozmístění objektů ve spojitém prostoru Tzv. Spatial pattern analysis; populární je K-kunction Jak jsou shluky velké Jak je shlukování intenzivní Jak se rozmístění mění v čase Jaký je prostorový vztah objektů různých kategorií (např. živých a mrtvých stromů, stromů dvou druhů apod.)

Binomické rozdělení Počet úspěchů z počtu nezávislých pokusů, každý pokus má stejnou pravděpodobnost úspěchu Model: Do každého hrnečku házím n-krát (třeba 5-krát), v každém pokusu mám pravděpodobnost p, že se trefím. Počet tref na hrneček má potom binomické rozdělení. Parametry jsou dva - n -počet pokusů, a p - pravděpodobnost úspěchu v každém pokusu. q - pravděpodobnost neúspěchu není další parametr, protože q =1-p

Binomické rozdělení 3 2

Platí

Rozdělení je symetrické (a při daném n nejbližší normálnímu pro p=q=1 se zvyšujícím se n se rozdělení přibližuje normálnímu

Nejčastější použití - odhad parametru p Jaké je (v celém sadu) procento červivých jablek Jaká je pokryvnost populace (point quadrat) Kolik (jaké procento) lidí v populaci má protilátky na boreliozu Kolik (jaké procento) lidí bude volit stranu mírného pokroku v mezích zákona

Máme n pokusů 100 (náhodně vybraných) vyšetřených jablek 50 (náhodně vybraných) vyšetřených lidí na boreliozu 800 (náhodně vybraných) respondentů v průzkumu

ze 100 jablek bylo 15 červivých, odhadneme p 0,15 (15%) Ale my neznáme p , známe jen jeho odhad

Při normální aproximaci je (1-) konfidenční interval Z(1 - /2) je (1-/2)*100-procentní kvantil normovaného normálního rozdělení Pozor, když půjdete mimo uvedené rozmezí, konfidenční interval se vám často mimo rozsah 0,1

Použití binomického rozdělení Mimo rozsah „normální aproximace“ lze užít kde F je (1-a/2)*100-procentní kvantil se stupni volnosti n1=2(n-X+1) a n2=2X a tady jsou stupně volnosti n’1=2(X+1) a n’2=2(n-X)

Použití binomického rozdělení Přesnost odhadu p stoupá s n Počet pozorování, která potřebujeme k tomu, aby byla střední chyba odhadu zhruba w je: Příklad: očekáváme, že v populaci je asi 20% jedinců s určitou vlastností a chceme jejich zastoupení určit se střední chybou 1%. K tomu potřebujeme z populace náhodně vybrat n = (0.2 * 0.8) / 0.012 = 1600 jedinců