Aplikovaná statistika

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

VÝPOČET OC.
TEORETICKÉ MODELY některých DISKRÉTNÍCH NV
Statistika.
Statistická indukce Teorie odhadu.
Limitní věty.
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Diskrétní rozdělení a jejich použití
Pravděpodobnost a statistika opakování základních pojmů
Generování náhodných veličin (1) Diskrétní rozdělení
Obsah prezentace Náhodná proměnná Rozdělení náhodné proměnné.
Náhodná veličina.
VY_32_INOVACE_21-01 PRAVDĚPODOBNOST 1 Úvod, základní pojmy.
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
také Gaussovo rozdělení (normal or Gaussian distribution)
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Vybraná rozdělení spojité náhodné veličiny
Odhady parametrů základního souboru
Generování náhodných veličin (2) Spojitá rozdělení
Nechť (, , P) je pravděpodobnostní prostor:
Některá diskrétní a spojitá rozdělení náhodné veličiny.
Odhady odhady bodové a intervalové odhady
Diskrétní rozdělení Karel Zvára 1.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Data s diskrétním rozdělením
POČET PRAVDĚPODOBNOSTI
Generování náhodných veličin Diskrétní a spojitá rozdělení Simulační modely ek.procesů 4.přednáška.
Definice stochastického procesu jako funkce 2 proměnných
Vybraná rozdělení spojité náhodné veličiny
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
Rozdělení diskrétních veličin. Příklady diskrétních náhodných veličin Pokus jev nastaljev nenastal pnS hod mincírublíc1/2počet hodůpočet rubů celkem narození.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Základy zpracování geologických dat
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
2. Vybrané základní pojmy matematické statistiky
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Škola:Chomutovské soukromé gymnázium Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Moderní škola Název materiálu:VY_32_INOVACE_MATEMATIKA1_ 19 Tematická.
Normální rozdělení a ověření normality dat
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
(Popis náhodné veličiny)
Poissonovo rozdělení diskrétní náhodné veličiny
Aritmetický průměr - střední hodnota
Inferenční statistika - úvod
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
1 Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Vladimír Mikulík. Slezské gymnázium, Opava, příspěvková organizace. Vzdělávací materiál.
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Odhady odhady bodové a intervalové odhady
Některá rozdělení náhodných veličin
Spojitá náhodná veličina
Náhodná veličina.
Základy statistické indukce
Induktivní statistika
Odhady parametrů základního souboru
Induktivní statistika
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Spojitá a kategoriální data Základní popisné statistiky
Normální (Gaussovo) rozdělení
Statistika a výpočetní technika
Rozdělení pravděpodobnosti
2. Vybrané základní pojmy matematické statistiky
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Transkript prezentace:

Aplikovaná statistika Náhodné veličiny. Popis a charakteristiky náhodné veličiny Spojité náhodné veličiny Nespojité náhodné veličiny Zákony velkých čísel

Popis a charakteristiky náhodné veličiny Výsledkem většiny náhodných pokusů jsou reálná čísla (počet poruch, doba do poruchy zařízení, příjem či vydání čtyřčlenné rodiny, náhodné číslo určené pomocí generátoru náhodných čísel apod.) Výsledkem náhodného pokusu je náhodná veličina. Rozlišujeme dva základní druhy náhodné veličiny: diskrétní (nespojitou) – může nabývat jenom konečně nebo spočetně nekonečně mnoha hodnot spojitou – může nabývat všech hodnot z nějakého konečného či nekonečného intervalu

Kvantilové charakteristiky náhodné veličiny jsou obvykle odvozeny pomocí distribuční funkce F(x) jsou určovány pro spojitou náhodnou veličinu, pro diskrétní náhodnou veličinu nebývá jejich určení jednoznačné p-kvantil dělí plochu pod grafem hustoty pravděpodobnosti v poměru p a (1-p)

Nejužívanější kvantily: kvartily: x0,25, x0,50, x0,75 - rozdělí obor možných hodnot na čtyři části, v nichž se náhodná veličina nachází s pravděpodobností 0,25 decily: x0,1, x0,2, ..., x0,9 - rozdělí obor možných hodnot na deset částí se stejnou pravděpodobností výskytu percentily: x0,01, x0,02, ..., x0,99 - rozdělí obor možných hodnot na sto částí se stejnou pravděpodobností výskytu x0,5 = Me . . . medián: dělí plochu pod křivkou hustoty pravděpodobnosti na dvě stejné části

Shrnutí Charakteristiky polohy E(X), Me, Mo, kvantily. Určují jakýsi "střed", kolem něhož kolísají hodnoty náhodné veličiny X. Charakteristiky variability D(X), σ, ... . Ukazují rozptýlenost hodnot náhodné veličiny kolem střední hodnoty Charakteristiky šikmosti a špičatosti Charakterizují průběh rozdělení náhodné veličiny X

Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny Alternativní rozdělení A(p) Některé náhodné pokusy mohou mít pouze dva různé výsledky: pokus je úspěšný pokus je neúspěšný Příslušná náhodná veličina X se pak nazývá alternativní (dvoubodová, nulajedničková). Tato náhodná veličina nabývá tedy pouze dvou hodnot: 1 - v případě příznivého výsledku pokusu (jev A), 0 - v případě nepříznivého výsledku pokusu (jev A). Obor hodnot tedy obsahuje dva prvky M = {0,1}. Používáme označení:P(A) = P(X = 1) = p P(A) = P(X = 0) = 1 - p

Příklad     Hod mincí: W = {líc,rub} Jedná se o alternativní rozdělení. Tedy: M = {0,1}; X = {0 v 1}

Rovnoměrné rozdělení R(n) Příklad: Hod kostkou: M = {1, 2, 3, 4, 5, 6} - každý výsledek je stejně pravděpodobný. Jedná se tedy o rovnoměrné rozdělení R(6), p(x) = 1/6.

Binomické rozdělení Toto rozdělení má náhodná veličina Y, která vznikne jako součet n nezávislých alternativně rozdělených náhodných veličin se stejným parametrem p, tedy: Y = X1 + X2 + … + Xn Příkladem takové náhodné veličiny je počet lvů při hodu n mincemi, při čemž pro každou minci je pravděpodobnost, že padne lev, rovna p. Střední hodnota binomicky rozdělené náhodné veličiny je součtem středních hodnot jednotlivých sčítanců E(Y) = E(X1 + X2 + … + Xn) = = = n * p a rozptyl je opět součet rozptylů jednotlivých sčítanců (veličiny jsou nezávislé) var(Y) = var(X1 + X2 + … + Xn) = = n * p * (1 – p) Hodnoty n a p jsou parametry binomického rozdělení. Skutečnost, že náhodná veličiny Y má binomické rozdělení, budeme vyjadřovat zkratkou Y  Bi(n, p). Pravděpodobnostní funkci náhodné veličiny Y  Bi(n, p) lze vyjádřit jako:

Výraz udává počet možností výběru k prvků z n různých prvků, 0 k  n. P(Y = k) = , kde k = 0, 1, 2, …, n Výraz udává počet možností výběru k prvků z n různých prvků, 0 k  n. Příklad: V příštím roce může firma potenciálně získat až šest zakázek. Pravděpodobnost získání zakázky je u všech zakázek padesátiprocentní. Náhodná veličina X představuje počet získaných zakázek. Obor hodnot, kterých tato náhodná veličina může nabývat je přitom X = {0;1;2;3;4;5;6}. Tato náhodná veličina potom podléhá binomickému rozdělení pravděpodobnosti Bi(6;0,5) a předpis její pravděpodobnostní funkce je ve tvaru a) Jaká je pravděpodobnost toho, že podnik získá 2 zakázky? b) Jaká je pravděpodobnost toho, že podnik získá alespoň jednu zakázku? c) Pravděpodobnost toho, že podnik získá maximálně jednu zakázku?

Poissonovo rozdělení Po(λ) Toto rozdělení pravděpodobnosti, pojmenované podle francouzského matematika S. D. Poissona, mají náhodné proměnné, které popisují četnosti jevů s těmito vlastnostmi: to, že jev v daném intervalu (časovém, prostorovém) nastane (nenastane), nezávisí na tom co se stalo jindy nebo jinde, pro každý časový okamžik je pravděpodobnost jevu v malém časovém intervalu stejná (totéž platí v prostoru), neexistuje případ, že by nastaly dva jevy přesně v jednom časovém okamžiku nebo místě v prostoru. Průměrný počet výskytů zkoumaného jevu v daném úseku jednotkové délky označujeme λ.

Příklad: Předpokládejme, že realitní makléř jedná v průměru s pěti zákazníky za den. Zjistěte jaká je pravděpodobnost, že počet zákazníků makléře za jeden den bude větší než 4.

Příklad: Pravděpodobnost výskytu nehody na křižovatce je 2 nehody za týden. Jaká je pravděpodobnost výskytu nejvýše 3 nehod v následujících 14 dnech.

Řešení: Pravděpodobnost výskytu nejvýše 3 nehod v následujících 14 dnech je 43,35 %.

Hypergeometrické rozdělení H(N, M, n) Má diskrétní NV, která vyjadřuje počet prvků se sledovanou vlastností mezi n prvky náhodně vybranými bez vracení z N prvků, mezi nimiž je M prvků se sledovanou vlastností. Závisí tedy na 3 parametrech: n... počet prvků ve výběru => vzorek vybraný z N objektů M... počet prvků se sledovanou vlastností N... počet všech prvků NV X je potom počtem objektů z M, které se vyskytují ze vzorku o rozsahu n. Pravděpodobnost, že ve vzorku bude x objektů majících sledovanou vlastnost je pak , kdy n N a M N

Příklad: Mezi stovkou výrobků je 20 zmetků. Vybereme deset výrobků a sledujeme počet zmetků mezi vybranými.

Geometrické rozdělení Budiž p Є (0,1). Pravděpodobnostní funkce geometrického rozdělení je dána vztahem , kde k = 0,1,…,n Příklad: Auto postupně projíždí křižovatkou se semafory a každá z křižovatek auto zastaví s pravděpodobností 1/3. Určete rozdělení pravděpodobnosti NV, počtu projetých křižovatek než bude auto zastaveno. p= 1/3 , kde x je počet pokusů, kdy q= 1-p = 2/3 jev nenastal

Základní typy rozdělení pravděpodobnosti spojité náhodné veličiny Exponenciální rozdělení E(λ) Toto rozdělení má spojitá náhodná veličina X, která představuje dobu čekání do nastoupení (poissonovského) náhodného jevu, nebo délku intervalu (časového nebo délkového) mezi takovými dvěma jevy (např. doba čekání na obsluhu, vzdálenost mezi dvěma poškozenými místy na silnici). Závisí na parametru λ, což je převrácená hodnota střední hodnoty doby čekání do nastoupení sledovaného jevu.

Tvar distribuční funkce, stejně jako vlastnosti exponenciálního rozdělení, lze odvodit obdobně jednoduchým způsobem, jako u rovnoměrného rozdělení.

Normální rozdělení N(μ, σ2) Označováno též obecné normální rozdělení či Gaussovo rozdělení (v anglicky psané literatuře nazývané rozdělení zvonovitého tvaru - bell curve). Je velmi důležité, neboť: nejčastěji se vyskytuje mnoho jiných rozdělení se mu blíží řada jiných rozdělení se jím dá nahradit

Grafem hustoty pravděpodobnosti je tzv Grafem hustoty pravděpodobnosti je tzv. Gaussova (Gaussova-Laplaceova) křivka: Z obrázku je patrné, že parametr μ (střední hodnota) určuje, kde má křivka maximum. Parametr σ (směrodatná odchylka) naproti tomu určuje, jak jsou po obou stranách od hodnoty m vzdáleny inflexní body, tedy jak je křivka roztažena do šířky. Distribuční funkce:

Příklad: Doba potřebná na vypracování testu na vysoké škole má normální rozdělení se střední hodnotou 110 minut a směrodatnou odchylkou 20 minut. Kolik procent studentů dokončí test do dvou hodin? Jak dlouho by měl test trvat, aby ho dokončilo právě 90 % studentů?

Poznámka Pomocí křivky normálního rozdělení popsal v roce 1773 matematik Abraham de Moivre limitní chování binomického rozdělení, když se snažil aproximovat výpočty jednotlivých pravděpodobností binomického rozdělení pro velká n. Rozdělení, které Moivre pro tento účel navrhl, se nakonec ukázalo být důležitější než výchozí binomické rozdělení. V roce 1812 odvodil nezávisle na Moivreovi normální rozdělení francouzský matematik Pierre Laplace. Jak Laplace, tak Karl Friedrich Gauss prezentovali toto rozdělení jako zákon chyb a používali ho pro interpretaci astronomických a geodetických měření, výsledků hazardních her a přesnosti dělostřelecké střelby.

Některá další rozdělení Weibullovo rozdělení W(δ, c) Toto rozdělení má spojitá náhodná veličina, která představuje dobu života (bezporuchovosti) technických zařízení, kterým nevyhovuje exponenciální. To jest tam, kde se projevuje mechanické opotřebení nebo únava materiálu. Parametr d závisí na materiálu, namáhání a podmínkách užívání (δ > 0); c > 0. Funkce hustoty pravděpodobnosti:

Grafické znázornění hustoty pravděpodobnosti pro δ = 1 a různé hodnoty c: Grafické znázornění distribuční funkce pro δ  = 1 a různé hodnoty c: Distribuční funkce:

Studentovo rozdělení tn Pearsonovo rozdělení Užití: Jestliže n nezávislých veličin X1,..., Xn má rozdělení N(0, 1), pak veličina X=X12+X22+...+Xn2 má Pearsonovo rozdělení. Studentovo rozdělení tn Jsou-li X1,X2 dvě nezávislé náhodné proměnné, kde X1 se řídí rozložením N(0, 1) a X2 rozložením , pak náhodná veličina má Studentovo rozložení s n stupni volnosti.

Zákon velkých čísel Obecné znění tohoto zákona je možno formulovat takto: Jestliže zvětšujeme počet náhodných pokusů, přibližuje se empirická charakteristika, popisující výsledky těchto pokusů, charakteristice teoretické. Věta Bernoulliho říká, že relativní četnost sledovaného jevu stochasticky konverguje k jeho pravděpodobnosti. Význam této věty spočívá v možnosti experimentálně odhadovat neznámou pravděpodobnost pomocí napozorované relativní četnosti. Bernoulliho věta je speciálním případem Čebyševovy věty. Ta tvrdí, že průměr nekorelovaných náhodných veličin X1, X2,…, jejichž rozptyl nepřevyšuje konečné kladné číslo K (rozptyly jsou tedy shora omezeny), stochasticky konverguje ke střední hodnotě.

Praktickým důsledkem Čebyševovy věty je možnost odhadovat střední hodnotu průměrem, pokud máme k dispozici dostatečně velký počet pozorování. Věta Moivrova-Laplaceova vyjadřuje konvergenci binomického rozdělení k rozdělení normálnímu. Provedeme-li n nezávislých pokusů, v nichž v každém může nastat sledovaný jev se stejnou pravděpodobností p, pak při dostatečně velkém počtu pokusů bude platit limitní vztah