V praxi je výhodné znát základní typy rozdělení náhodných veličin. Statistické metody jsou vyvinuty pro konkrétní typy rozdělení, v předpokladech použití statistických testů se často vyskytuje konkrétní typ rozdělení. Náhodné veličiny jsou buď diskrétní, nebo spojité. Diskrétní rozdělení. Alternativní rozdělení. Náhodná veličina může nabýt pouze 2 hodnot s pravděpodobnostmi p a (1-p). EX = p, var X = p (1 – p). Příklad. Hod kostkou. Náhodný jev w …“padne 6“, náhodná veličina X(w) = 1, X(w/) = 0 p(1) = 1/6, p(0) = 5/6. EX = p = 1/6, var X = p (1 – p) = 5/36.
Binomické rozdělení. Četnost jevu v n pokusech, výskyt tohoto jevu s pravděpodobností p. X (w) = k, k = 0, 1, 2, …, n Podle Bernoulliho schématu je , dále m = np, s2 = npq, kde q = 1-p Příklad. Pravděpodobnost, že náhodně vybrané jablko je červivé je p = 0.2. Nakreslete Pravděpodobnostní a distribuční funkci pro n = 100 jablek.
Náhodnou veličinu X s binomickým rozdělením s parametry n a p si můžeme představit jako součet n náhodných veličin Yn s alternativním rozdělením s parametrem p. Příklad. Pravděpodobnost, že náhodně vybrané jablko je zdravé je p = 0.8. Četnost červivých jablek v souboru s n jablky má binomické rozdělení s parametry p a n. Každé jablko je nezávisle náhodně vybráno a je buď červivé (1-p = 0.2), nebo zdravé (p = 0.8). Náhodná veličina Y „náhodně vybrané jablko je zdravé“ nabývá hodnoty 1 s pravděpodobností p, hodnoty 0 s pravděpodobností 1- p. V souboru rozsahu n je i jablek zdravých, , kde pouze i náhodných proměnných Yk nabývá nenulové hodnoty.
Jevy „právě k pokusů z n je úspěšných“, k = 0, 1, …, n se navzájem vylučují, jeden z nich však vždy nastane. Proto součet pravděpodobností těchto jevů je pravděpodobnost jevu jistého, neboli 1. Předpokládáme-li n nezávislých pokusů, z nichž každý skončí úspěchem s pravděpodobností p a neúspěchem s pravděpodobností 1 – p = q, pak
Poissonovo rozdělení. Četnost jevu v mnoha pokusech, výskyt tohoto jevu s malou pravděpodobností p. Toto rozdělení pravděpodobnosti, pojmenované podle francouzského matematika S. D. Poissona, mají náhodné proměnné, které popisují četnosti jevů s těmito vlastnostmi: to, že jev v daném intervalu (časovém, prostorovém) nastane (nenastane), nezávisí na tom co se stalo jindy nebo jinde, pro každý časový okamžik je pravděpodobnost jevu v malém časovém intervalu stejná (totéž platí v prostoru), neexistuje případ, že by nastaly dva jevy přesně v jednom časovém okamžiku nebo místě v prostoru. Průměrný počet výskytů zkoumaného jevu v daném úseku jednotkové délky označujeme l.
X (w) = k = 0, 1, 2, … , m = l, s2 = l Příklad. Telefonní ústředna zapojí během hodiny průměrně 40 hovorů. Nakreslete pravděpodobnostní křivku pro náhodnou veličinu X: “v k-té minutě spojí ústředna právě 1 hovor“, k = 0, 1, …, 60. Náhodný jev 𝜔…právě jeden hovor je spojen, náhodná veličina X (𝜔) = k … v k-té minutě je právě jeden hovor spojen m = l = 40,
Poznámka S rostoucí hodnotou l se toto rozdělení blíží k normálnímu rozdělení (viz. dále). Jestliže náhodná veličina má binomické rozdělení, pak tvar jejího rozložení se blíží k Poissonovu s parametrem l = n.p, jestliže n je velké a p se blíží k nule. Aproximativně můžeme tedy binomické rozdělení s velkým n a malou hodnotou p nahradit Poissonovým rozdělením. Součet nezávislých proměnných s Poissonovým rozdělením je opět rozdělen podle tohoto rozdělení. Jestliže máme n pozorování Poissonova rozdělení s parametrem l, pak součet pozorování je možné považovat za pozorování s Poissonovým rozdělením a parametrem nl. Příkad. Předpokládejme, že realitní makléř jedná v průměru s pěti zákazníky za den. Zjistěte jaká je pravděpodobnost, že počet zákazníků makléře za jeden den bude větší než 4. (Náhodná veličina X: počet zákazníků.) P(X > 4) = 1 – p(0) – p(1) – p(2) – p(3) – p(4) = 0.56
Typickými příklady na Poissonovo rozdělení jsou například: počet předmětů nalezených a odevzdaných denně v obchodním domě počet telefonních hovorů v určitém časovém úseku počet úrazů na dělníka za rok. Příklad. Skvělou (a slavnou) ukázku shody Poissonova rozdělení a reality podal německý ekonom a statistik Ladislaus Josephovich Bortkiewicz (1868 - 1931), který v roce 1898 vydal knihu Právo malých množství, v níž mj. zveřejnil svá pozorování za dobu 20 let o počtu vojáků zabitých kopnutím koněm za rok, a to v 10 vojenských sborech kavalérie německé armády. Zjistil, že u 109 ukazatelů „armádní sbor/rok“ nebyl žádný smrtelný úraz, 65 krát byl jeden mrtvý, 22 krát dva mrtví, 3 krát tři mrtví, jedenkrát dokonce čtyři. Celkový počet smrtelných případů byl 122 = (65 + 44 + 9 + 4), „očekávaná střední hodnota“ smrtelných případů na rok a armádní sbor činí tedy 122/(20•10) = 0.61. Vyjdeme-li z této očekávané hodnoty, můžeme porovnat, zda tyto nehody mohou být přibližně správně zachyceny Poissonovým rozdělením. 𝑝 𝑘 = 𝑘 𝑘! 𝑒 − , kde = 0.61, k = 0,1,2,3,4 je počet mtvých. Tedy p(0) = 0.543, p(1) = 0.331, p(2) = 0.101, p(3) = 0.021, p(4) = 0.003. Úrazy se sledovaly 20 let u 10 sborů, očekávané četnosti jsou tedy p(k)*200, neboli
počet mrtvých 1 2 3 4 skutečnost 109 65 22 výpočet (očekávání) 108.6 66.2 20.2 4.2 0.6 Příklad. Pan Kohn prodává látky. Z textilky ADIO si objednal 50 stometrových balíků. Pak se od souseda dozvěděl, že jeho synovec říkal, že v textilce dlouhodobě bývá na 1000 m látky v průměru 5 kazů a ten to musí vědět, protože tam pracuje jeho švagrová. Jaký střední počet bezvadných balíků, může pan Kohn očekávat? Pravděpodobnost výskytu kazu na jednom metru je p = 0,005 (p ≤ 0,1), jeden balík má n = 100 metrů (n > 30) a tedy lze použít Poissonovo rozdělení s λ = np = 0,5. Pravděpodobnost, že v balíku nebude žádný kaz je tedy p(0) = e-0,5 = 0,60653. Očekávaná střední hodnota bezvadných balíků je 50•0,60653 ~ 30 ks. Příklad. Když zemře člověk ve věku 35–36 let, je to vždy překvapení. Statistický úřad uvádí, že pravděpodobnost takového úmrtí je 0,004. Jaká je pravděpodobnost, že ze skupiny 1000 osob ve věku 35-36 let zemře během letošního roku právě 10, resp. nejvýše 10 lidí? Jde o řídký jev s průměrným ročním výskytem λ = 1000*0.004 = 4. Pravděpodobnost, že zemře právě 10 lidí je p(10) = 0,00529, pravděpodobnost, že zemře nejvýše 10 lidí je P(X ≤ 10) = p(0) + p(1) + … + p(10) = 0,99706
Hypergeometrické rozdělení. V souboru N výrobků je A zmetků. Ze souboru náhodně (nezávisle) vybereme n výrobků. Náhodná veličina “ve výběru je právě a zmetků“ má hypergeometrické Rozdělení. (n < N, a < A, A < N). , m = nA/N, Příklad. V souboru 100 výrobků je 10 zmetků. Ze souboru náhodně (nezávisle) vybereme 20 výrobků. Nakreslete rozdělení pravděpodobností náhodná veličiny “ve výběru je právě a zmetků“
Geometrické rozdělení. V sérii nezávislých pokusů sledujeme výskyt jevu A, který nastává s pravděpodobností p. Pravděpodobnost, že jev A nastane poprvé v (k+1)-ním pokusu po předchozích k pokusech, kdy nenastal, je rovna 𝑝 𝑘 = (1−𝑝) 𝑘 𝑝 , m = 1 𝑝 , 𝜎 2 = 1 𝑝 ( 1 𝑝 −1). Příklad. Distribuční funkce geometrického rozdělení. Distribuční funkce je po částech konstantní. 1≤𝑥<2 znamená, že v 1. pokusu nastal jev A, tedy F(x) = P(x=1) = p. 2≤𝑥<3 znamená, že v 2. pokusu nastal jev A, tedy F(x) = P(x=1) + P(x=2) = p + p(1-p). Obecně 𝑛≤𝑥<𝑛+1 znamená, že v n-tém. pokusu nastal jev A, tedy F(x) = 𝑝 𝑖=0 𝑛−1 (1−𝑝) 𝑖 =𝑝 1− (1−𝑝) 𝑛 1−(1−𝑝) =1− (1−𝑝) 𝑛 , jestliže použijeme vzorec pro částečný součet geometrické řady s kvocientem (1- p).
Spojitá rozdělení. Rovnoměrné rozdělení na intervalu (a, b). f ( x ) = 1/(b-a), x(a, b), f ( x ) = 0 jinak , m = (a + b)/2, s2 = (b – a)2/12, a < b. Rovnoměrné rozdělení a = 0 se používá např. při modelování doby čekání na událost, která nastává v pravidelných intervalech délky b (čekání na událost zahajujeme v okamžiku, který je nezávislý na minulém ani budoucím výskytu události). Příklad. Trolejbusová linka číslo 3 odjíždí v dopoledních hodinách ze zastávky každých 10 minut. Vypočtěte pravděpodobnost, že na ni budete dopoledne čekat déle než 7 minut. Doba čekání je náhodná veličina X, která má rovnoměrné rozdělení pravděpodobnosti f (x) = 1/10, x<0, 10>; f(x) = 0 jinak, dále F(x) = x/10, x<0, 10>; F(x) = 0, x < 0; F(x) = 1, x > 10, P (x > 7) = 1 – p(0) – p(1) - … - p(7) = 1- 0.7 = 0.3
Exponenciální rozdělení. Toto rozdělení má spojitá náhodná veličina X, která představuje dobu čekání do nastoupení náhodného jevu, nebo délku intervalu (časového nebo délkového) mezi takovými dvěma jevy (které mají Poissonovo rozdělení) (např. doba čekání na obsluhu, vzdálenost mezi dvěma poškozenými místy na silnici). Závisí na parametru l, což je převrácená hodnota střední hodnoty doby čekání do nastoupení sledovaného jevu. Hustota rozdělení f je dána vztahem , f(x) = 0 jinak. Distribuční funkce F ( x ) = , F (x) = 0, x < 0.
Střední hodnota m = 1 / l, variance s2 = 1 / l2. Příklad. Doba čekání hosta na pivo je v restauraci průměrně 5 minut. Určete: a) hustotu pravděpodobnosti náhodné veličiny, která je dána dobou čekání na pivo b) pravděpodobnost, že budeme čekat na pivo déle než 12 minut c) dobu čekání, během které bude zákazník obsloužen s pravděpodobností 0.9 , f ( x ) = 0 jinak. P( X > 12) = 1- F(12) = 1 – (1 - ) 0.0907 F(t) – F(0) = 1 - - 0 = 0.9 t 11 minut 30 sekund
Normální rozdělení se střední hodnotou m a variancí s2, N(m, s 2). , grafem je Gaussova křivka 3. centrální moment (šikmost) = 0, 4. centrální moment (špičatost) = 3. Pokud m = 0, a s2 = 1, mluvíme o normovaném normálním rozdělení N (0,1).
Pomocí křivky normálního rozdělení popsal v roce 1773 matematik Abraham de Moivre limitní chování binomického rozdělení, když se snažil aproximovat výpočty jednotlivých pravděpodobností binomického rozdělení pro velká n. Rozdělení, které Moivre pro tento účel navrhl, se nakonec ukázalo být důležitější než výchozí binomické rozdělení. V roce 1812 odvodil nezávisle na Moivreovi normální rozdělení francouzský matematik Pierre Laplace. Jak Laplace, tak Karl Friedrich Gauss prezentovali toto rozdělení jako zákon chyb a používali ho pro interpretaci astronomických a geodetických měření, výsledků hazardních her a přesnosti dělostřelecké střelby. Poznámky. Normalita rozdělení zůstává zachována lineárními transformacemi. Jestliže náhodná veličina X má rozdělení N(m, s 2), pak náhodná veličina Y= 𝛼𝑋+𝛽 má Rozdělení 𝑁(𝛼𝜇+𝛽, 𝛼 2 𝜎 2 ). Speciálně náhodná veličina 𝑋 − 𝜇 𝜎 má normované normální rozdělení N(0, 1).
Kvantily normálního rozdělení. Označme 𝜑 𝑥 = 1 2𝜋 𝑒 − 𝑥 2 2 hustotu N(0,1) a 𝑥 = 1 2𝜋 −∞ 𝑥 𝑒 − 𝑡 2 2 𝑑𝑡 distribuční funkci N(0, 1). Pak 𝑢 𝑝 je p-kvantil N(0,1), jestliže platí 𝑢 𝑝 =𝑝 𝑢 𝑝 = −1 𝑝 . p 𝑢 𝑝
Plocha od −∞ do 𝑢 𝑝 se rovná p
2 rozdělení o n stupních volnosti. Gama funkce: , a > 0 2 rozdělení o n stupních volnosti. , x > 0, m = n, s 2 = 2n
Studentovo t rozdělení o n stupních volnosti. , m = 0, s 2 = n/(n – 2)
Motivace pro centrální limitní větu. Mějme náhodný výběr X1, …, Xn z rozdělení, které má parametry m, s2 (střední hodnota, variance). Pak náhodná veličina má střední hodnotu 0 a varianci 1. Mějme náhodné veličiny X1, …, Xn, se středními hodnotami m1, …, mn a variancemi s12, …, sn 2. Nechť Y je náhodná veličina se střední hodnotou mY a variancí sY2. Nechť a1, …, an jsou libovolná reálná čísla. Jestliže , pak a .
Centrální limitní věta. Nechť je výběrový průměr n-prvkového náhodného výběru z rozdělení se střední hodnotou 𝜇 a variancí 𝜎 2 . Pak náhodná veličina má rozdělení N(0, 1) pro n +. Aproximace binomického binomického rozdělení normálním rozdělením. Binomické rozdělení X s parametry n, p má střední hodnotu m = np a variancí s2 = np(1-p) a lze ho napsat jako součet n náhodných veličin s alternativním rozdělením s parametrem p. Podle centrální limitní věty má náhodná veličina pro velká n rozdělení N(0,1). 𝑊= 𝑋 −𝜇 𝜎 𝑛 𝑊= 𝑋 −𝜇 𝜎 𝑛 = 1 𝑛 𝑋 𝑖 −𝜇 𝜎/ 𝑛 = 𝑋 𝑖 −𝑛𝜇 𝜎 𝑛 ≈𝑁(0,1) V binomickém rozdělení je m = np, s 2 = np(1-p).
Dosadíme do předchozího vzorce: 𝑋= 𝑋 𝑖 =𝑊 𝑛𝑝(1−𝑝) +𝑛𝑝 Protože W N(0, 1), můžeme X Bi (p, n) aproximovat N (np, np(1-p)). Poznámka. Pro velké rozsahy výběru je možno náhodnou veličinu X s Poissonovým rozdělením s parametrem n = l (tedy Po (l)) aproximovat N(l, l).