Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Jak modelovat výsledky náh. pokusů?
Martina Litschmannová, Adéla Vrtková
2
Opakování Základní pojmy z teorie pravděpodobnosti
Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž probíhá. Co je to náhodný jev? Tvrzení o výsledku náhodného pokusu, přičemž o pravdivosti tohoto tvrzení lze po ukončení pokusu rozhodnout.
3
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … výsledek hodu kostkou Náhodná veličina je zobrazení, které každému elementárnímu jevu 𝜔∈Ω přiřazuje reálné číslo. Náhodný pokus: Hod kostkou Náhodný jev: Padne sudé číslo. 𝑋∈ 2;4;6
4
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … teplota měřena na určitém místě v určitý čas (°C) Náhodný pokus: Měření teploty na určitém místě v určitý čas. Náhodný jev: Zjištěná teplota bude větší než 3°C. 𝑋>3
5
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … doba do remise onemocnění Náhodný pokus: Pozorování doby do remise onemocnění Náhodný jev: Doba do remise nepřekročí 60 měsíců. 𝑋≤60
6
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … roční mzda jednotlivých občanů (euro) Náhodný pokus: Zjišťování příjmů jednotlivých občanů Náhodný jev: Roční mzda občana nepřekročí euro. 𝑋≤10 000
7
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu POZOR! Číselně vyjádření lze použít i u veličin, které nejsou kvantitativní ze své podstaty (např. pohlaví – muž (0), žena (1)).
8
K čemu potřebujeme popisovat chování náhodné veličiny?
Neznámá populace Model populace vytváření modelu cílové populace
9
Jak popsat chování náhodné veličiny?
Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jak zadat rozdělení pravděpodobnosti? funkci zadanou analyticky, výčtem hodnot NV a příslušných pravděpodobností.
10
Jak popsat chování náhodné veličiny?
Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jaké zadat rozdělení pravděpodobnosti? distribuční funkcí, pravděpodobnostní funkcí (diskrétní NV), hustotou pravděpodobnosti (spojitá NV).
11
Distribuční funkce 𝐹(𝑥)
Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina 𝑋 bude menší než dané reálné číslo t. 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!
12
Distribuční funkce Ukázka distribuční funkce diskrétní náhodné veličiny Ukázka distribuční funkce spojité náhodné veličiny
13
Základní typy náhodných veličin
Diskrétní NV – mohou nabývat spočetně mnoha hodnot Příklady: počet vadných výrobků z 20 testovaných, počet pokusů do úspěšného navázání spojení, počet požadavků ve frontě, počet měření zatížených hrubou chybou, … Spojité NV – mohou nabývat všech hodnot na nějakém intervalu (mají spojitou distribuční funkci) Příklady: doba obsluhy, chyba měření, výška, hmotnost, osvětlení, napětí v síti, …
14
Základní typy náhodných veličin
Diskrétní náhodná veličina (dále DNV) může nabývat spočetně mnoha hodnot DNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována pravděpodobnostní funkcí 𝑃 𝑋= 𝑥 𝑖 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑋= 𝑥 𝑖 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Spojitá náhodná veličina (dále SNV) může nabývat všech hodnot na nějakém intervalu (má spojitou distribuční funkci) SNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována hustotou pravděpodobností 𝑓 𝑥 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥
15
Rozdělení pravděpodobnosti diskrétní náhodné veličiny
16
Diskrétní náhodná veličina
Definice Náhodná veličina X má diskrétní rozdělení pravděpodobnosti (zkráceně: „je diskrétní“) právě když nabývá spočetně mnoha hodnot. DNV lze charakterizovat: pravděpodobnostní funkcí, distribuční funkcí
17
Pravděpodobnostní funkce
𝑃 𝑥 𝑖 ≥0 𝑖 𝑃 𝑋= 𝑥 𝑖 =1 Lze zadat: předpisem, ∀𝑥∈ 0;1;2 :𝑃 𝑋=𝑥 = 2 𝑥 ∙ 0,33 𝑥 ∙ 0,67 3−𝑥 tabulkou, grafem. 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000
18
1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači 𝑝 … pravděpodobnost, že na počítači je nainstalován nelegální software, 𝑝=0,33 𝑃 𝑋=0 = 1−𝑝 ∙ 1−𝑝 ≅0,449 𝑃 𝑋=2 =𝑝∙𝑝=0,109 𝑃 𝑋=1 =1− 𝑝 2 − 1−𝑝 2 ≅0,442 (nebo 𝑃 𝑋=1 =𝑝∙ 1−𝑝 + 1−𝑝 ∙𝑝) 𝑥 1 2 celkem 𝑃(𝑥) 1,000
19
1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači 𝑝 … pravděpodobnost, že na počítači je nainstalován nelegální software, 𝑝=0,33 𝑃 𝑋=0 = 1−𝑝 ∙ 1−𝑝 ≅0,449 𝑃 𝑋=2 =𝑝∙𝑝=0,109 𝑃 𝑋=1 =1− 𝑝 2 − 1−𝑝 2 ≅0,442 (nebo 𝑃 𝑋=1 =𝑝∙ 1−𝑝 + 1−𝑝 ∙𝑝) 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000
20
1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Distribuční funkce: ? 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000
21
Vztah mezi pravděpodobnostní a distribuční funkcí
22
Vztah mezi pravděpodobnostní a distribuční funkci
Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.
23
Vztah mezi pravděpodobnostní a distribuční funkci
Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.
24
Vztah mezi pravděpodobnostní a distribuční funkci
Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 („=velikost skoku v bodě a“)
25
Vztah mezi pravděpodobnostní a distribuční funkci
𝟎,𝟒𝟒𝟐 𝟎,𝟒𝟒𝟐 Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 („=velikost skoku v bodě a“)
26
Vztah mezi pravděpodobnosti a distribuční funkci
𝟎,𝟒𝟒𝟐 𝟎,𝟒𝟒𝟐 Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 , tj. velikost „skoku“ distribuční funkce v bodech nespojitosti je rovna příslušným hodnotám pravděpodobnostní funkce.
27
1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙 −∞; 0 0; 1 1; 2 2;∞ 𝑭(𝒙) 0,000 0,449 0, 891 1,000
28
Distribuční funkce 𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem,
𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem, tabulkou, grafem. 𝐹 𝑥 = 0 , 𝑥≤0 0, <𝑥≤1 0, <𝑥≤2 1, <𝑥 𝑥 −∞; 0 0; 1 1; 2 2;∞ 𝐹(𝑥) 0,000 0,449 0, 891 1,000
29
Distribuční funkce 𝐹(𝑥)
Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina X bude menší než dané reálné číslo t. Vlastnosti distribuční funkce: 0≤𝐹 𝑡 ≤1, je neklesající, je zleva spojitá, má nejvýše spočetně mnoho bodů nespojitosti, lim 𝑡→−∞ 𝐹 𝑡 =0 („začíná“ v 0), lim 𝑡→∞ 𝐹 𝑡 =1 („končí“ v 1). 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!
30
Vztah mezi pravděpodobnosti a distribuční funkcí
𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎
31
Vztah mezi pravděpodobnosti a distribuční funkcí
𝑃 𝑋<𝑎 =𝐹 𝑎 = 𝑥 𝑖 <𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 = 𝑥 𝑖 ≥𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = 𝑎≤𝑥 𝑖 <𝑏 𝑃( 𝑥 𝑖 ) 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹(𝑎) .
32
2 Počet počítačů s nelegálním softwarem (ze 2 testovaných) lze modelovat náhodnou veličinou s distribuční funkci 𝐹 𝑥 = 0,000, 𝑥∈ −∞; 0 0,449, 𝑥∈ 0; 1 0,891, 𝑥∈ 1; 2 1,000, 𝑥∈ 2;∞ . Určete pravděpodobnostní funkci dané náhodné veličiny. 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000
33
Rozdělení pravděpodobnosti spojité náhodné veličiny
34
Spojitá náhodná veličina
Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí Proč se pro popis SNV nepoužívá pravděpodobnostní funkce?
35
Spojitá náhodná veličina
Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí SNV má spojitou distribuční funkci a proto: ∀𝑥∈ℝ:𝑃 𝑥 =0
36
Hustota pravděpodobnosti 𝑓(𝑥)
𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥 ⇒ 𝑓 𝑥 = 𝑑𝐹 𝑑𝑥 Vlastnosti hustoty pravděpodobnosti 𝑓 𝑥 je reálná nezáporná funkce, −∞ ∞ 𝑓 𝑥 =1 (plocha pod křivkou hustoty je 1), lim 𝑥→−∞ 𝑓 𝑥 =0 („začíná v 0“), lim 𝑥→∞ 𝑓 𝑥 =0 („končí v 0“) 𝑓(𝑥) může nabývat hodnot vyšších než 1!!!
37
Distribuční funkce 𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥
38
Vztah mezi pravděpodobností a distribuční funkcí
39
Vztah mezi pravděpodobnosti, hustotou a distr. funkcí
𝑃 𝑋<𝑎 =𝐹 𝑎 = −∞ 𝑎 𝑓 𝑥 𝑑𝑥 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 =1− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 ∞ 𝑓 𝑥 𝑑𝑥 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = = −∞ 𝑏 𝑓 𝑥 𝑑𝑥− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 𝑏 𝑓 𝑥 𝑑𝑥 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎 =0 Je-li náhodná veličina X spojitá, pak lze ve výše uvedených nerovnostech zaměňovat symboly ostré a neostré nerovnosti, tj. 𝑃 𝑋<𝑎 =𝑃 𝑋≤𝑎 apod.
40
Určete distribuční funkci 𝐹 𝑥 .
3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 𝑐, 𝑥∈ 0;10 0, 𝑥∉ 0;10 Určete konstantu 𝑐. Určete distribuční funkci 𝐹 𝑥 . Určete pravděpodobnost, že cestující bude čekat nejvýše 5 minut; alespoň 3 minuty; právě 7 minut.
41
3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞
42
3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞
43
3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞
44
3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞ 𝑃 𝑋=7 =0
45
Číselné charakteristiky náhodných veličin
46
Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota Kvantily Modus Míry variability Rozptyl Směrodatná odchylka Variační koeficient Míry šikmosti a špičatosti Šikmost Špičatost
47
Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ) pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥
48
Význam střední hodnoty
DNV - Střední hodnota je formou váženého průměru možných hodnot s váhami odpovídajícími jejich pravděpodobnostem. Střední hodnota ≈ těžiště 𝐸 𝑋 =𝜇= (𝑖) 𝑥 𝑖 ∙𝑃 𝑥 𝑖 možné hodnoty váhy E(X) E(X)
49
Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ) pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥 Kvantily (angl. quantiles; 100𝑝% kvantil (𝑝-kvantil) se značí 𝑥 𝑝 ) 𝑃 𝑋< 𝑥 𝑝 =𝑝⇒𝐹 𝑥 𝑝 =𝑝 ⇒ 𝑥 𝑝 = 𝐹 −1 (𝑝) Kvantily se obvykle určují pouze pro SNV.
50
Význačné kvantily Kvartily Dolní kvartil 𝑥 0,25 Medián 𝑥 0,5
Horní kvartil 𝑥 0,75 Decily – 𝑥 0,1 ; 𝑥 0,2 ; ... ; 𝑥 0,9 Percentily – 𝑥 0,01 ; 𝑥 0,02 ; …; 𝑥 0,03 Minimum 𝑥 𝑚𝑖𝑛 a Maximum 𝑥 𝑚𝑎𝑥
51
Kde se setkáme s kvantily?
52
Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ) pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥 Kvantily (angl. quantiles; 100𝑝% kvantil (𝑝-kvantil) se značí 𝑥 𝑝 ) 𝑃 𝑋< 𝑥 𝑝 =𝑝⇒𝐹 𝑥 𝑝 =𝑝 ⇒ 𝑥 𝑝 = 𝐹 −1 (𝑝) Modus (angl. mode; značí se 𝑋 ) pro diskrétní NV: ∀ 𝑥 𝑖 : 𝑃 𝑋= 𝑋 ≥𝑃 𝑋= 𝑥 𝑖 pro spojitou NV: ∀𝑥: 𝑓 𝑋 ≥𝑓 𝑥
53
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. E 𝑋 = 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000
54
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. E 𝑋 = 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660
55
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. E 𝑋 = 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 =𝟎,𝟔𝟔𝟎 𝑋 =𝟎 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660
56
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. Při kontrole 2 počítačů lze očekávat průměrně 0,660 počítačů s nelegálním softwarem. Obvykle (nejčastěji) však lze očekávat, že žádný ze 2 kontrolovaných počítačů nebude mít nainstalován nelegální software. 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660
57
Číselné charakteristiky náhodných veličin
Míry variability Rozptyl (angl. dispersion, variance; značí se 𝐷 𝑋 ) pro diskrétní NV: D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 pro spojitou NV: D 𝑋 = −∞ ∞ 𝑥 2 ∙𝑓 𝑥 𝑑𝑥 − 𝐸 𝑋 2
58
Význam rozptylu Rozptyl ≈ Variabilita dat kolem střední hodnoty
𝑫 𝑿𝟏 <𝑫(𝑿𝟐) Jednotka rozptylu je kvadrátem jednotky náhodné veličiny!!! Tato nevýhoda rozptylu je důvodem zavedení směrodatné odchylky.
59
Číselné charakteristiky náhodných veličin
Míry variability Rozptyl (angl. dispersion, variance; značí se 𝐷 𝑋 ) pro diskrétní NV: D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 pro spojitou NV: D 𝑋 = −∞ ∞ 𝑥 2 ∙𝑓 𝑥 𝑑𝑥 − 𝐸 𝑋 2 Směrodatná odchylka (angl. standard deviation; značí se 𝜎 𝑋 ) 𝜎(𝑋)= 𝐷(𝑋)
60
Směrodatná odchylka Směrodatná odchylka 𝝈
Jakou představu o náhodné veličině X si lze udělat na základě její stř. hodnoty 𝜇 a sm. odchylky 𝜎? Směrodatná odchylka neumožňuje srovnávat variabilitu náhodných veličin měřených v různých jednotkách! Proto zavádíme var. koeficient. 𝜎(𝑋)= 𝐷(𝑋) ∀𝑘>0:𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 (Čebyševova nerovnost) k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 >0 2 >0,75 3 >0,89
61
Číselné charakteristiky náhodných veličin
Míry variability Rozptyl (angl. dispersion, variance; značí se 𝐷 𝑋 ) pro diskrétní NV: D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 pro spojitou NV: D 𝑋 = −∞ ∞ 𝑥 2 ∙𝑓 𝑥 𝑑𝑥 − 𝐸 𝑋 2 Směrodatná odchylka (angl. standard deviation; značí se 𝜎 𝑋 ) 𝜎(𝑋)= 𝐷(𝑋) Variační koeficient (angl. coefficient of variation; značí se C𝑉 𝑋 ) 𝐶𝑉= 𝜎 𝜇 , resp. 𝜎 𝜇 ∙100 (%) Var. koef. 𝑪𝑽 je definován pouze pro nezáporné náhodné veličiny!
62
Variační koeficient Variační koeficient 𝑪𝑽 je definován pouze pro nezáporné náhodné veličiny. Variační koeficient – směrodatná odchylka v procentech střední hodnoty Čím nižší var. koeficient, tím homogennější soubor. 𝐶𝑉>0,5 ⇒ mluvíme o silně rozptýlené náhodné veličině. 𝐶𝑉= 𝜎 𝜇 , resp. 𝜎 𝜇 ∙100 (%)
63
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660
64
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660 𝒙 𝟐 ∙𝑷(𝒙) 0,436 0,878
65
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 =0,878− 0,660 2 ≅𝟎,𝟒𝟒𝟐 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660 𝒙 𝟐 ∙𝑷(𝒙) 0,436 0,878
66
4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 ≅𝟎,𝟒𝟒𝟐, 𝜎 𝑋 = 𝐷(𝑋) ≅𝟎,𝟔𝟔𝟓 , 𝐶𝑉 𝑋 = 𝜎 𝑋 𝜇 = 0,665 0,660 =𝟏,𝟎𝟎𝟖 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660 𝒙 𝟐 ∙𝑷(𝒙) 0,436 0,878
67
Číselné charakteristiky náhodných veličin
Míry šikmosti a špičatosti Šikmost (angl. skewness) Špičatost (angl. kurtosis)
68
Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin?
Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.
69
pozitivně zešikmené rozdělení
Šikmost 𝛼 3 Míra symetrie rozdělení NV x f(x) x f(x) x f(x) 𝛼 3 <0 negativně zešikmené rozdělení 𝛼 3 =0 symetrické rozdělení 𝛼 3 >0 pozitivně zešikmené rozdělení 𝐸(𝑋)< 𝑥 0,5 < 𝑥 𝑥 = 𝑥 0,5 =𝐸(𝑋) 𝑥 < 𝑥 0,5 <𝐸(𝑋) obvykle
70
Špičatost 𝛼 4 x f(x) x f(x) x f(x) míra koncentrace kolem průměru
standardizovaná špičatost 𝛼 4 −3 x f(x) x f(x) x f(x) 𝛼 4 <3 špičatost menší než u norm. rozdělení (plošší rozdělení) 𝛼 4 =3 špičatost odpovídající normálnímu rozdělení 𝛼 4 >3 špičatost větší než u norm. rozdělení (špičatější rozdělení)
71
Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin?
Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g1, angl. skewness) a špičatost (g2, angl. kurtosis).
72
Literatura Litschmannová, M. (2012), Vybrané kapitoly z pravděpodobnosti, elektronická skripta a doplňkové interaktivní materiály (kapitola Úvod do teorie pravděpodobnosti) Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN (kapitola 3)
73
DěkujEME za pozornost!
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.