Aplikovaná statistika Náhodné veličiny. Popis a charakteristiky náhodné veličiny Spojité náhodné veličiny Nespojité náhodné veličiny Zákony velkých čísel
Popis a charakteristiky náhodné veličiny Výsledkem většiny náhodných pokusů jsou reálná čísla (počet poruch, doba do poruchy zařízení, příjem či vydání čtyřčlenné rodiny, náhodné číslo určené pomocí generátoru náhodných čísel apod.) Výsledkem náhodného pokusu je náhodná veličina. Rozlišujeme dva základní druhy náhodné veličiny: diskrétní (nespojitou) – může nabývat jenom konečně nebo spočetně nekonečně mnoha hodnot spojitou – může nabývat všech hodnot z nějakého konečného či nekonečného intervalu
Kvantilové charakteristiky náhodné veličiny jsou obvykle odvozeny pomocí distribuční funkce F(x) jsou určovány pro spojitou náhodnou veličinu, pro diskrétní náhodnou veličinu nebývá jejich určení jednoznačné p-kvantil dělí plochu pod grafem hustoty pravděpodobnosti v poměru p a (1-p)
Nejužívanější kvantily: kvartily: x0,25, x0,50, x0,75 - rozdělí obor možných hodnot na čtyři části, v nichž se náhodná veličina nachází s pravděpodobností 0,25 decily: x0,1, x0,2, ..., x0,9 - rozdělí obor možných hodnot na deset částí se stejnou pravděpodobností výskytu percentily: x0,01, x0,02, ..., x0,99 - rozdělí obor možných hodnot na sto částí se stejnou pravděpodobností výskytu x0,5 = Me . . . medián: dělí plochu pod křivkou hustoty pravděpodobnosti na dvě stejné části
Shrnutí Charakteristiky polohy E(X), Me, Mo, kvantily. Určují jakýsi "střed", kolem něhož kolísají hodnoty náhodné veličiny X. Charakteristiky variability D(X), σ, ... . Ukazují rozptýlenost hodnot náhodné veličiny kolem střední hodnoty Charakteristiky šikmosti a špičatosti Charakterizují průběh rozdělení náhodné veličiny X
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny Alternativní rozdělení A(p) Některé náhodné pokusy mohou mít pouze dva různé výsledky: pokus je úspěšný pokus je neúspěšný Příslušná náhodná veličina X se pak nazývá alternativní (dvoubodová, nulajedničková). Tato náhodná veličina nabývá tedy pouze dvou hodnot: 1 - v případě příznivého výsledku pokusu (jev A), 0 - v případě nepříznivého výsledku pokusu (jev A). Obor hodnot tedy obsahuje dva prvky M = {0,1}. Používáme označení:P(A) = P(X = 1) = p P(A) = P(X = 0) = 1 - p
Příklad Hod mincí: W = {líc,rub} Jedná se o alternativní rozdělení. Tedy: M = {0,1}; X = {0 v 1}
Rovnoměrné rozdělení R(n) Příklad: Hod kostkou: M = {1, 2, 3, 4, 5, 6} - každý výsledek je stejně pravděpodobný. Jedná se tedy o rovnoměrné rozdělení R(6), p(x) = 1/6.
Binomické rozdělení Toto rozdělení má náhodná veličina Y, která vznikne jako součet n nezávislých alternativně rozdělených náhodných veličin se stejným parametrem p, tedy: Y = X1 + X2 + … + Xn Příkladem takové náhodné veličiny je počet lvů při hodu n mincemi, při čemž pro každou minci je pravděpodobnost, že padne lev, rovna p. Střední hodnota binomicky rozdělené náhodné veličiny je součtem středních hodnot jednotlivých sčítanců E(Y) = E(X1 + X2 + … + Xn) = = = n * p a rozptyl je opět součet rozptylů jednotlivých sčítanců (veličiny jsou nezávislé) var(Y) = var(X1 + X2 + … + Xn) = = n * p * (1 – p) Hodnoty n a p jsou parametry binomického rozdělení. Skutečnost, že náhodná veličiny Y má binomické rozdělení, budeme vyjadřovat zkratkou Y Bi(n, p). Pravděpodobnostní funkci náhodné veličiny Y Bi(n, p) lze vyjádřit jako:
Výraz udává počet možností výběru k prvků z n různých prvků, 0 k n. P(Y = k) = , kde k = 0, 1, 2, …, n Výraz udává počet možností výběru k prvků z n různých prvků, 0 k n. Příklad: V příštím roce může firma potenciálně získat až šest zakázek. Pravděpodobnost získání zakázky je u všech zakázek padesátiprocentní. Náhodná veličina X představuje počet získaných zakázek. Obor hodnot, kterých tato náhodná veličina může nabývat je přitom X = {0;1;2;3;4;5;6}. Tato náhodná veličina potom podléhá binomickému rozdělení pravděpodobnosti Bi(6;0,5) a předpis její pravděpodobnostní funkce je ve tvaru a) Jaká je pravděpodobnost toho, že podnik získá 2 zakázky? b) Jaká je pravděpodobnost toho, že podnik získá alespoň jednu zakázku? c) Pravděpodobnost toho, že podnik získá maximálně jednu zakázku?
Poissonovo rozdělení Po(λ) Toto rozdělení pravděpodobnosti, pojmenované podle francouzského matematika S. D. Poissona, mají náhodné proměnné, které popisují četnosti jevů s těmito vlastnostmi: to, že jev v daném intervalu (časovém, prostorovém) nastane (nenastane), nezávisí na tom co se stalo jindy nebo jinde, pro každý časový okamžik je pravděpodobnost jevu v malém časovém intervalu stejná (totéž platí v prostoru), neexistuje případ, že by nastaly dva jevy přesně v jednom časovém okamžiku nebo místě v prostoru. Průměrný počet výskytů zkoumaného jevu v daném úseku jednotkové délky označujeme λ.
Příklad: Předpokládejme, že realitní makléř jedná v průměru s pěti zákazníky za den. Zjistěte jaká je pravděpodobnost, že počet zákazníků makléře za jeden den bude větší než 4.
Příklad: Pravděpodobnost výskytu nehody na křižovatce je 2 nehody za týden. Jaká je pravděpodobnost výskytu nejvýše 3 nehod v následujících 14 dnech.
Řešení: Pravděpodobnost výskytu nejvýše 3 nehod v následujících 14 dnech je 43,35 %.
Hypergeometrické rozdělení H(N, M, n) Má diskrétní NV, která vyjadřuje počet prvků se sledovanou vlastností mezi n prvky náhodně vybranými bez vracení z N prvků, mezi nimiž je M prvků se sledovanou vlastností. Závisí tedy na 3 parametrech: n... počet prvků ve výběru => vzorek vybraný z N objektů M... počet prvků se sledovanou vlastností N... počet všech prvků NV X je potom počtem objektů z M, které se vyskytují ze vzorku o rozsahu n. Pravděpodobnost, že ve vzorku bude x objektů majících sledovanou vlastnost je pak , kdy n N a M N
Příklad: Mezi stovkou výrobků je 20 zmetků. Vybereme deset výrobků a sledujeme počet zmetků mezi vybranými.
Geometrické rozdělení Budiž p Є (0,1). Pravděpodobnostní funkce geometrického rozdělení je dána vztahem , kde k = 0,1,…,n Příklad: Auto postupně projíždí křižovatkou se semafory a každá z křižovatek auto zastaví s pravděpodobností 1/3. Určete rozdělení pravděpodobnosti NV, počtu projetých křižovatek než bude auto zastaveno. p= 1/3 , kde x je počet pokusů, kdy q= 1-p = 2/3 jev nenastal
Základní typy rozdělení pravděpodobnosti spojité náhodné veličiny Exponenciální rozdělení E(λ) Toto rozdělení má spojitá náhodná veličina X, která představuje dobu čekání do nastoupení (poissonovského) náhodného jevu, nebo délku intervalu (časového nebo délkového) mezi takovými dvěma jevy (např. doba čekání na obsluhu, vzdálenost mezi dvěma poškozenými místy na silnici). Závisí na parametru λ, což je převrácená hodnota střední hodnoty doby čekání do nastoupení sledovaného jevu.
Tvar distribuční funkce, stejně jako vlastnosti exponenciálního rozdělení, lze odvodit obdobně jednoduchým způsobem, jako u rovnoměrného rozdělení.
Normální rozdělení N(μ, σ2) Označováno též obecné normální rozdělení či Gaussovo rozdělení (v anglicky psané literatuře nazývané rozdělení zvonovitého tvaru - bell curve). Je velmi důležité, neboť: nejčastěji se vyskytuje mnoho jiných rozdělení se mu blíží řada jiných rozdělení se jím dá nahradit
Grafem hustoty pravděpodobnosti je tzv Grafem hustoty pravděpodobnosti je tzv. Gaussova (Gaussova-Laplaceova) křivka: Z obrázku je patrné, že parametr μ (střední hodnota) určuje, kde má křivka maximum. Parametr σ (směrodatná odchylka) naproti tomu určuje, jak jsou po obou stranách od hodnoty m vzdáleny inflexní body, tedy jak je křivka roztažena do šířky. Distribuční funkce:
Příklad: Doba potřebná na vypracování testu na vysoké škole má normální rozdělení se střední hodnotou 110 minut a směrodatnou odchylkou 20 minut. Kolik procent studentů dokončí test do dvou hodin? Jak dlouho by měl test trvat, aby ho dokončilo právě 90 % studentů?
Poznámka Pomocí křivky normálního rozdělení popsal v roce 1773 matematik Abraham de Moivre limitní chování binomického rozdělení, když se snažil aproximovat výpočty jednotlivých pravděpodobností binomického rozdělení pro velká n. Rozdělení, které Moivre pro tento účel navrhl, se nakonec ukázalo být důležitější než výchozí binomické rozdělení. V roce 1812 odvodil nezávisle na Moivreovi normální rozdělení francouzský matematik Pierre Laplace. Jak Laplace, tak Karl Friedrich Gauss prezentovali toto rozdělení jako zákon chyb a používali ho pro interpretaci astronomických a geodetických měření, výsledků hazardních her a přesnosti dělostřelecké střelby.
Některá další rozdělení Weibullovo rozdělení W(δ, c) Toto rozdělení má spojitá náhodná veličina, která představuje dobu života (bezporuchovosti) technických zařízení, kterým nevyhovuje exponenciální. To jest tam, kde se projevuje mechanické opotřebení nebo únava materiálu. Parametr d závisí na materiálu, namáhání a podmínkách užívání (δ > 0); c > 0. Funkce hustoty pravděpodobnosti:
Grafické znázornění hustoty pravděpodobnosti pro δ = 1 a různé hodnoty c: Grafické znázornění distribuční funkce pro δ = 1 a různé hodnoty c: Distribuční funkce:
Studentovo rozdělení tn Pearsonovo rozdělení Užití: Jestliže n nezávislých veličin X1,..., Xn má rozdělení N(0, 1), pak veličina X=X12+X22+...+Xn2 má Pearsonovo rozdělení. Studentovo rozdělení tn Jsou-li X1,X2 dvě nezávislé náhodné proměnné, kde X1 se řídí rozložením N(0, 1) a X2 rozložením , pak náhodná veličina má Studentovo rozložení s n stupni volnosti.
Zákon velkých čísel Obecné znění tohoto zákona je možno formulovat takto: Jestliže zvětšujeme počet náhodných pokusů, přibližuje se empirická charakteristika, popisující výsledky těchto pokusů, charakteristice teoretické. Věta Bernoulliho říká, že relativní četnost sledovaného jevu stochasticky konverguje k jeho pravděpodobnosti. Význam této věty spočívá v možnosti experimentálně odhadovat neznámou pravděpodobnost pomocí napozorované relativní četnosti. Bernoulliho věta je speciálním případem Čebyševovy věty. Ta tvrdí, že průměr nekorelovaných náhodných veličin X1, X2,…, jejichž rozptyl nepřevyšuje konečné kladné číslo K (rozptyly jsou tedy shora omezeny), stochasticky konverguje ke střední hodnotě.
Praktickým důsledkem Čebyševovy věty je možnost odhadovat střední hodnotu průměrem, pokud máme k dispozici dostatečně velký počet pozorování. Věta Moivrova-Laplaceova vyjadřuje konvergenci binomického rozdělení k rozdělení normálnímu. Provedeme-li n nezávislých pokusů, v nichž v každém může nastat sledovaný jev se stejnou pravděpodobností p, pak při dostatečně velkém počtu pokusů bude platit limitní vztah