Diskrétní rozdělení a jejich použití Poissonovo a binomické rozdělení
Diskrétní rozdělení Mohou nabývat pouze určitých hodnot Nejčastější jsou ty, co mohou nabývat pouze celočíselných hodnot Nejběžnější jsou Poissonovo a binomické Další běžná jsou negativně binomické a Neymannovo (A a B)
Poissonovo rozdělení
Poissonovo rozdělení Model: Mám velmi mnoho hrníčků, a mnohokrát házím kuličkou. Každým hodem se do nějakého hrníčku trefím. Každý hod je nezávislý na předchozích (tzn., že přítomnost kuličky v hrníčku neovlivní, zda se do něj znovu trefím). Počet kuliček v hrnečku bude potom mít Poissonovskou distribuci. Její jediný parametr, λ, je poměrem celkového počtu kuliček k počtu hrníčků (a tedy průměrným počtem kuliček v hrníčku).
Poissonovo rozdělení
Poissonovo rozdělení Střední hodnota i variance rozdělení = λ
Rozdělení je vždy pozitivně šikmé, nicméně čím větší λ, tím menší šikmost. Při velkém λ se rozdělení blíží normálnímu
Na co se používá Poissonovská proměnná jako odpověď (v ANOVě, regresi): Buď použiji Zobecněné lineární modely (mají Poissonovskou distribuci jako jednu z možností) Nebo provedu odmocninovou transformaci Ta by měla rozdělení zesymetričtit a zároveň stabilizovat varianci
Zjišťování náhodnosti ve spojitém prostoru (třeba hořce na louce) si musíme vymyslet zkusné jednotky nebo v diskrétních jednotkách (pro parazity na kapru nebo počet rekombinačních nodů na chromozomu)
Poissonovo rozdělení: zjišťování náhodnosti rozmístění Jsou květenství rozmístěna náhodně? Umístím přes plochu čtverce (náhodně na část nebo pravidelnou síť) Spočítám průměr a varianci: pro náhodné rozmístění budou mít počty ve čtvercích Poissonovo rozdělení, průměr rovný varianci
Pokud jsou individual rozmístěna náhodně Počty individuí v náhodně umístěných čtvercích mají Poissonovo rozdělení - tedy Pokud v jednotce najdu jedno individuum, nemění se pravděpodobnost, že najdu další
Pokud jsou individual rozmístěna shlukovitě Počty individuí v náhodně umístěných čtvercích mají Pokud v jednotce najdu jedno individuum, zvyšuje to pravděpodobnost, že najdu další POZOR – záleží na velikosti čtverce Hříbky rostou shlukovitě, a proto když najdu, hledám “bratříčka”
Pokud je tendence k pravidelnosti či úplná pravidelnost Pokud v jednotce najdu jedno individuum, snižuje to pravděpodobnost, že najdu další
Poměr (pro počet individuí) je pak považován za charakteristiku rozmístění individuí Populární je i Lloydův index - ten se nemění, pokud individua náhodně vymírají
Odchylku od náhodnosti lze testovat: 1. Klasický test shody s Poissonovým rozdělením 2. má přibližně 2 rozdělení s n-1 stupni volnosti v případě, že se jedná o Poissonovo rozdělení.
Řada metod pro popis rozmístění objektů ve spojitém prostoru Tzv. Spatial pattern analysis; populární je K-kunction Jak jsou shluky velké Jak je shlukování intenzivní Jak se rozmístění mění v čase Jaký je prostorový vztah objektů různých kategorií (např. živých a mrtvých stromů, stromů dvou druhů apod.)
Binomické rozdělení Počet úspěchů z počtu nezávislých pokusů, každý pokus má stejnou pravděpodobnost úspěchu Model: Do každého hrnečku házím n-krát (třeba 5-krát), v každém pokusu mám pravděpodobnost p, že se trefím. Počet tref na hrneček má potom binomické rozdělení. Parametry jsou dva - n -počet pokusů, a p - pravděpodobnost úspěchu v každém pokusu. q - pravděpodobnost neúspěchu není další parametr, protože q =1-p
Binomické rozdělení 3 2
Platí
Rozdělení je symetrické (a při daném n nejbližší normálnímu pro p=q=1 se zvyšujícím se n se rozdělení přibližuje normálnímu
Nejčastější použití - odhad parametru p Jaké je (v celém sadu) procento červivých jablek Jaká je pokryvnost populace (point quadrat) Kolik (jaké procento) lidí v populaci má protilátky na boreliozu Kolik (jaké procento) lidí bude volit stranu mírného pokroku v mezích zákona
Máme n pokusů 100 (náhodně vybraných) vyšetřených jablek 50 (náhodně vybraných) vyšetřených lidí na boreliozu 800 (náhodně vybraných) respondentů v průzkumu
ze 100 jablek bylo 15 červivých, odhadneme p 0,15 (15%) Ale my neznáme p , známe jen jeho odhad
Při normální aproximaci je (1-) konfidenční interval Z(1 - /2) je (1-/2)*100-procentní kvantil normovaného normálního rozdělení Pozor, když půjdete mimo uvedené rozmezí, konfidenční interval se vám často mimo rozsah 0,1
Použití binomického rozdělení Mimo rozsah „normální aproximace“ lze užít kde F je (1-a/2)*100-procentní kvantil se stupni volnosti n1=2(n-X+1) a n2=2X a tady jsou stupně volnosti n’1=2(X+1) a n’2=2(n-X)
Použití binomického rozdělení Přesnost odhadu p stoupá s n Počet pozorování, která potřebujeme k tomu, aby byla střední chyba odhadu zhruba w je: Příklad: očekáváme, že v populaci je asi 20% jedinců s určitou vlastností a chceme jejich zastoupení určit se střední chybou 1%. K tomu potřebujeme z populace náhodně vybrat n = (0.2 * 0.8) / 0.012 = 1600 jedinců