V praxi je výhodné znát základní typy rozdělení náhodných veličin.

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

Některá diskrétní a spojitá rozdělení náhodné veličiny.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
Experimentální metody v oboru – Aproximace 1/14 Aproximace Teze přednášek z předmětu „Technický experiment“ © Zdeněk Folta - verze
Mgr. Renáta Davidová.  Hrací plocha je rozdělena do 2 sloupců, které představují různé kategorie otázek.  Každé otázce ve sloupci je přiřazeno bodové.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Induktivní statistika
POČET PRAVDĚPODOBNOSTI
Mocniny, odmocniny, úpravy algebraických výrazů
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
Náhodná veličina je veličina, která při opakování náhodného pokusu mění své hodnoty v závislosti na náhodě Náhodné veličiny označujeme X, Y, Z, ... hodnoty.
Interpolace funkčních závislostí
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Lineární funkce - příklady
STATISTICKÉ METODY V GEOGRAFII
„Svět se skládá z atomů“
Výběrové metody (Výběrová šetření)
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
Vybraná rozdělení pravděpodobnosti
Výukový materiál zpracován v rámci projektu
Soustava dvou lineárních rovnic se dvěma neznámými
SIMULAČNÍ MODELY.
Poměr v základním tvaru.
Základy statistické indukce
Repetitorium z matematiky Podzim 2012 Ivana Medková
Molekulová fyzika 3. prezentace.
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
GENEROVÁNÍ HODNOT NÁHODNÝCH VELICIN PSEUDONÁHODNÁ ČÍSLA
APLIKACE MATEMATIKY A FYZIKY A Matematická část 2
Kvadratické nerovnice
Matematika pro stavební obory 19. Autor: RNDr. Zdeněk Bláha
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
V.a1 Teoretické pozadí statistické analýzy
BIBS Informatika pro ekonomy přednáška 2
8.1.3 Lineární obal konečné množiny vektorů
Spojité VELIČINY Vyšetřování normality dat
Rovnice základní pojmy.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Pravděpodobnost a statistika
STATISTIKA Exaktní věda Úkoly statistiky zjišťovat data
XII. Binomické rozložení
Jiří Vyskočil, Marko Genyg-Berezovskyj 2010
Základní statistické pojmy
Úvod do praktické fyziky
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
TŘÍDĚNÍ DAT je základní způsob zpracování dat.
Cauchyho rozdělení spojité náhodné veličiny
Poměr v základním tvaru.
Běžná pravděpodobnostní rozdělení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
KOMBINACE BEZ OPAKOVÁNÍ
Teorie chyb a vyrovnávací počet 1
Náhodný jev, náhodná proměnná
Centrální limitní věta
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Lineární rovnice Druhy řešení.
Teorie chyb a vyrovnávací počet 1
Více náhodných veličin
Příklady - opakování Auto se pohybovalo 3 hodiny stálou rychlostí 80 km/h, poté 2 hodiny rychlostí 100 km/h, pak 30 minut stálo a nakonec 2,5 hodiny rychlostí.
… jak přesně počítat s nepřesnými čísly
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
Tečné a normálové zrychlení
Transkript prezentace:

V praxi je výhodné znát základní typy rozdělení náhodných veličin. Statistické metody jsou vyvinuty pro konkrétní typy rozdělení, v předpokladech použití statistických testů se často vyskytuje konkrétní typ rozdělení. Náhodné veličiny jsou buď diskrétní, nebo spojité. Diskrétní rozdělení. Alternativní rozdělení. Náhodná veličina může nabýt pouze 2 hodnot s pravděpodobnostmi p a (1-p). EX = p, var X = p (1 – p). Příklad. Hod kostkou. Náhodný jev w …“padne 6“, náhodná veličina X(w) = 1, X(w/) = 0 p(1) = 1/6, p(0) = 5/6. EX = p = 1/6, var X = p (1 – p) = 5/36.

Binomické rozdělení. Četnost jevu v n pokusech, výskyt tohoto jevu s pravděpodobností p. X (w) = k, k = 0, 1, 2, …, n Podle Bernoulliho schématu je , dále m = np, s2 = npq, kde q = 1-p Příklad. Pravděpodobnost, že náhodně vybrané jablko je červivé je p = 0.2. Nakreslete Pravděpodobnostní a distribuční funkci pro n = 100 jablek.

Náhodnou veličinu X s binomickým rozdělením s parametry n a p si můžeme představit jako součet n náhodných veličin Yn s alternativním rozdělením s parametrem p. Příklad. Pravděpodobnost, že náhodně vybrané jablko je zdravé je p = 0.8. Četnost červivých jablek v souboru s n jablky má binomické rozdělení s parametry p a n. Každé jablko je nezávisle náhodně vybráno a je buď červivé (1-p = 0.2), nebo zdravé (p = 0.8). Náhodná veličina Y „náhodně vybrané jablko je zdravé“ nabývá hodnoty 1 s pravděpodobností p, hodnoty 0 s pravděpodobností 1- p. V souboru rozsahu n je i jablek zdravých, , kde pouze i náhodných proměnných Yk nabývá nenulové hodnoty.

Jevy „právě k pokusů z n je úspěšných“, k = 0, 1, …, n se navzájem vylučují, jeden z nich však vždy nastane. Proto součet pravděpodobností těchto jevů je pravděpodobnost jevu jistého, neboli 1. Předpokládáme-li n nezávislých pokusů, z nichž každý skončí úspěchem s pravděpodobností p a neúspěchem s pravděpodobností 1 – p = q, pak

Poissonovo rozdělení. Četnost jevu v mnoha pokusech, výskyt tohoto jevu s malou pravděpodobností p. Toto rozdělení pravděpodobnosti, pojmenované podle francouzského matematika S. D. Poissona, mají náhodné proměnné, které popisují četnosti jevů s těmito vlastnostmi: to, že jev v daném intervalu (časovém, prostorovém) nastane (nenastane), nezávisí na tom co se stalo jindy nebo jinde, pro každý časový okamžik je pravděpodobnost jevu v malém časovém intervalu stejná (totéž platí v prostoru), neexistuje případ, že by nastaly dva jevy přesně v jednom časovém okamžiku nebo místě v prostoru. Průměrný počet výskytů zkoumaného jevu v daném úseku jednotkové délky označujeme l.

X (w) = k = 0, 1, 2, … , m = l, s2 = l Příklad. Telefonní ústředna zapojí během hodiny průměrně 40 hovorů. Nakreslete pravděpodobnostní křivku pro náhodnou veličinu X: “v k-té minutě spojí ústředna právě 1 hovor“, k = 0, 1, …, 60. Náhodný jev 𝜔…právě jeden hovor je spojen, náhodná veličina X (𝜔) = k … v k-té minutě je právě jeden hovor spojen m = l = 40,

Poznámka S rostoucí hodnotou l se toto rozdělení blíží k normálnímu rozdělení (viz. dále). Jestliže náhodná veličina má binomické rozdělení, pak tvar jejího rozložení se blíží k Poissonovu s parametrem l = n.p, jestliže n je velké a p se blíží k nule. Aproximativně můžeme tedy binomické rozdělení s velkým n a malou hodnotou p nahradit Poissonovým rozdělením. Součet nezávislých proměnných s Poissonovým rozdělením je opět rozdělen podle tohoto rozdělení. Jestliže máme n pozorování Poissonova rozdělení s parametrem l, pak součet pozorování je možné považovat za pozorování s Poissonovým rozdělením a parametrem nl. Příkad. Předpokládejme, že realitní makléř jedná v průměru s pěti zákazníky za den. Zjistěte jaká je pravděpodobnost, že počet zákazníků makléře za jeden den bude větší než 4. (Náhodná veličina X: počet zákazníků.) P(X > 4) = 1 – p(0) – p(1) – p(2) – p(3) – p(4) = 0.56

Typickými příklady na Poissonovo rozdělení jsou například: počet předmětů nalezených a odevzdaných denně v obchodním domě počet telefonních hovorů v určitém časovém úseku počet úrazů na dělníka za rok. Příklad. Skvělou (a slavnou) ukázku shody Poissonova rozdělení a reality podal německý ekonom a statistik Ladislaus Josephovich Bortkiewicz (1868 - 1931), který v roce 1898 vydal knihu Právo malých množství, v níž mj. zveřejnil svá pozorování za dobu 20 let o počtu vojáků zabitých kopnutím koněm za rok, a to v 10 vojenských sborech kavalérie německé armády. Zjistil, že u 109 ukazatelů „armádní sbor/rok“ nebyl žádný smrtelný úraz, 65 krát byl jeden mrtvý, 22 krát dva mrtví, 3 krát tři mrtví, jedenkrát dokonce čtyři. Celkový počet smrtelných případů byl 122 = (65 + 44 + 9 + 4), „očekávaná střední hodnota“ smrtelných případů na rok a armádní sbor činí tedy 122/(20•10) = 0.61. Vyjdeme-li z této očekávané hodnoty, můžeme porovnat, zda tyto nehody mohou být přibližně správně zachyceny Poissonovým rozdělením. 𝑝 𝑘 =  𝑘 𝑘! 𝑒 − , kde  = 0.61, k = 0,1,2,3,4 je počet mtvých. Tedy p(0) = 0.543, p(1) = 0.331, p(2) = 0.101, p(3) = 0.021, p(4) = 0.003. Úrazy se sledovaly 20 let u 10 sborů, očekávané četnosti jsou tedy p(k)*200, neboli

počet mrtvých 1 2 3 4 skutečnost 109 65 22 výpočet (očekávání) 108.6 66.2 20.2 4.2 0.6 Příklad. Pan Kohn prodává látky. Z textilky ADIO si objednal 50 stometrových balíků. Pak se od souseda dozvěděl, že jeho synovec říkal, že v textilce dlouhodobě bývá na 1000 m látky v průměru 5 kazů a ten to musí vědět, protože tam pracuje jeho švagrová. Jaký střední počet bezvadných balíků, může pan Kohn očekávat? Pravděpodobnost výskytu kazu na jednom metru je p = 0,005 (p ≤ 0,1), jeden balík má n = 100 metrů (n > 30) a tedy lze použít Poissonovo rozdělení s λ = np = 0,5. Pravděpodobnost, že v balíku nebude žádný kaz je tedy p(0) = e-0,5 = 0,60653. Očekávaná střední hodnota bezvadných balíků je 50•0,60653 ~ 30 ks. Příklad. Když zemře člověk ve věku 35–36 let, je to vždy překvapení. Statistický úřad uvádí, že pravděpodobnost takového úmrtí je 0,004. Jaká je pravděpodobnost, že ze skupiny 1000 osob ve věku 35-36 let zemře během letošního roku právě 10, resp. nejvýše 10 lidí? Jde o řídký jev s průměrným ročním výskytem λ = 1000*0.004 = 4. Pravděpodobnost, že zemře právě 10 lidí je p(10) = 0,00529, pravděpodobnost, že zemře nejvýše 10 lidí je P(X ≤ 10) = p(0) + p(1) + … + p(10) = 0,99706

Hypergeometrické rozdělení. V souboru N výrobků je A zmetků. Ze souboru náhodně (nezávisle) vybereme n výrobků. Náhodná veličina “ve výběru je právě a zmetků“ má hypergeometrické Rozdělení. (n < N, a < A, A < N). , m = nA/N, Příklad. V souboru 100 výrobků je 10 zmetků. Ze souboru náhodně (nezávisle) vybereme 20 výrobků. Nakreslete rozdělení pravděpodobností náhodná veličiny “ve výběru je právě a zmetků“

Geometrické rozdělení. V sérii nezávislých pokusů sledujeme výskyt jevu A, který nastává s pravděpodobností p. Pravděpodobnost, že jev A nastane poprvé v (k+1)-ním pokusu po předchozích k pokusech, kdy nenastal, je rovna 𝑝 𝑘 = (1−𝑝) 𝑘 𝑝 , m = 1 𝑝 , 𝜎 2 = 1 𝑝 ( 1 𝑝 −1). Příklad. Distribuční funkce geometrického rozdělení. Distribuční funkce je po částech konstantní. 1≤𝑥<2 znamená, že v 1. pokusu nastal jev A, tedy F(x) = P(x=1) = p. 2≤𝑥<3 znamená, že v 2. pokusu nastal jev A, tedy F(x) = P(x=1) + P(x=2) = p + p(1-p). Obecně 𝑛≤𝑥<𝑛+1 znamená, že v n-tém. pokusu nastal jev A, tedy F(x) = 𝑝 𝑖=0 𝑛−1 (1−𝑝) 𝑖 =𝑝 1− (1−𝑝) 𝑛 1−(1−𝑝) =1− (1−𝑝) 𝑛 , jestliže použijeme vzorec pro částečný součet geometrické řady s kvocientem (1- p).

Spojitá rozdělení. Rovnoměrné rozdělení na intervalu (a, b). f ( x ) = 1/(b-a), x(a, b), f ( x ) = 0 jinak , m = (a + b)/2, s2 = (b – a)2/12, a < b. Rovnoměrné rozdělení a = 0 se používá např. při modelování doby čekání na událost, která nastává v pravidelných intervalech délky b (čekání na událost zahajujeme v okamžiku, který je nezávislý na minulém ani budoucím výskytu události). Příklad. Trolejbusová linka číslo 3 odjíždí v dopoledních hodinách ze zastávky každých 10 minut. Vypočtěte pravděpodobnost, že na ni budete dopoledne čekat déle než 7 minut. Doba čekání je náhodná veličina X, která má rovnoměrné rozdělení pravděpodobnosti f (x) = 1/10, x<0, 10>; f(x) = 0 jinak, dále F(x) = x/10, x<0, 10>; F(x) = 0, x < 0; F(x) = 1, x > 10, P (x > 7) = 1 – p(0) – p(1) - … - p(7) = 1- 0.7 = 0.3

Exponenciální rozdělení. Toto rozdělení má spojitá náhodná veličina X, která představuje dobu čekání do nastoupení náhodného jevu, nebo délku intervalu (časového nebo délkového) mezi takovými dvěma jevy (které mají Poissonovo rozdělení) (např. doba čekání na obsluhu, vzdálenost mezi dvěma poškozenými místy na silnici). Závisí na parametru l, což je převrácená hodnota střední hodnoty doby čekání do nastoupení sledovaného jevu. Hustota rozdělení f je dána vztahem , f(x) = 0 jinak. Distribuční funkce F ( x ) = , F (x) = 0, x < 0.

Střední hodnota m = 1 / l, variance s2 = 1 / l2. Příklad. Doba čekání hosta na pivo je v restauraci průměrně 5 minut. Určete: a) hustotu pravděpodobnosti náhodné veličiny, která je dána dobou čekání na pivo b) pravděpodobnost, že budeme čekat na pivo déle než 12 minut c) dobu čekání, během které bude zákazník obsloužen s pravděpodobností 0.9 , f ( x ) = 0 jinak. P( X > 12) = 1- F(12) = 1 – (1 - )  0.0907 F(t) – F(0) = 1 - - 0 = 0.9 t  11 minut 30 sekund

Normální rozdělení se střední hodnotou m a variancí s2, N(m, s 2). , grafem je Gaussova křivka 3. centrální moment (šikmost) = 0, 4. centrální moment (špičatost) = 3. Pokud m = 0, a s2 = 1, mluvíme o normovaném normálním rozdělení N (0,1).

Pomocí křivky normálního rozdělení popsal v roce 1773 matematik Abraham de Moivre limitní chování binomického rozdělení, když se snažil aproximovat výpočty jednotlivých pravděpodobností binomického rozdělení pro velká n. Rozdělení, které Moivre pro tento účel navrhl, se nakonec ukázalo být důležitější než výchozí binomické rozdělení. V roce 1812 odvodil nezávisle na Moivreovi normální rozdělení francouzský matematik Pierre Laplace. Jak Laplace, tak Karl Friedrich Gauss prezentovali toto rozdělení jako zákon chyb a používali ho pro interpretaci astronomických a geodetických měření, výsledků hazardních her a přesnosti dělostřelecké střelby. Poznámky. Normalita rozdělení zůstává zachována lineárními transformacemi. Jestliže náhodná veličina X má rozdělení N(m, s 2), pak náhodná veličina Y= 𝛼𝑋+𝛽 má Rozdělení 𝑁(𝛼𝜇+𝛽, 𝛼 2 𝜎 2 ). Speciálně náhodná veličina 𝑋 − 𝜇 𝜎 má normované normální rozdělení N(0, 1).

Kvantily normálního rozdělení. Označme 𝜑 𝑥 = 1 2𝜋 𝑒 − 𝑥 2 2 hustotu N(0,1) a  𝑥 = 1 2𝜋 −∞ 𝑥 𝑒 − 𝑡 2 2 𝑑𝑡 distribuční funkci N(0, 1). Pak 𝑢 𝑝 je p-kvantil N(0,1), jestliže platí  𝑢 𝑝 =𝑝  𝑢 𝑝 =  −1 𝑝 . p 𝑢 𝑝

Plocha od −∞ do 𝑢 𝑝 se rovná p

2 rozdělení o n stupních volnosti. Gama funkce: , a > 0 2 rozdělení o n stupních volnosti. , x > 0, m = n, s 2 = 2n

Studentovo t rozdělení o n stupních volnosti. , m = 0, s 2 = n/(n – 2)

Motivace pro centrální limitní větu. Mějme náhodný výběr X1, …, Xn z rozdělení, které má parametry m, s2 (střední hodnota, variance). Pak náhodná veličina má střední hodnotu 0 a varianci 1. Mějme náhodné veličiny X1, …, Xn, se středními hodnotami m1, …, mn a variancemi s12, …, sn 2. Nechť Y je náhodná veličina se střední hodnotou mY a variancí sY2. Nechť a1, …, an jsou libovolná reálná čísla. Jestliže , pak a .

Centrální limitní věta. Nechť je výběrový průměr n-prvkového náhodného výběru z rozdělení se střední hodnotou 𝜇 a variancí 𝜎 2 . Pak náhodná veličina má rozdělení N(0, 1) pro n  +. Aproximace binomického binomického rozdělení normálním rozdělením. Binomické rozdělení X s parametry n, p má střední hodnotu m = np a variancí s2 = np(1-p) a lze ho napsat jako součet n náhodných veličin s alternativním rozdělením s parametrem p. Podle centrální limitní věty má náhodná veličina pro velká n rozdělení N(0,1). 𝑊= 𝑋 −𝜇 𝜎 𝑛 𝑊= 𝑋 −𝜇 𝜎 𝑛 = 1 𝑛 𝑋 𝑖 −𝜇 𝜎/ 𝑛 = 𝑋 𝑖 −𝑛𝜇 𝜎 𝑛 ≈𝑁(0,1) V binomickém rozdělení je m = np, s 2 = np(1-p).

Dosadíme do předchozího vzorce: 𝑋= 𝑋 𝑖 =𝑊 𝑛𝑝(1−𝑝) +𝑛𝑝 Protože W  N(0, 1), můžeme X  Bi (p, n) aproximovat N (np, np(1-p)). Poznámka. Pro velké rozsahy výběru je možno náhodnou veličinu X s Poissonovým rozdělením s parametrem n = l (tedy Po (l)) aproximovat N(l, l).