Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jak modelovat výsledky náh. pokusů?

Podobné prezentace


Prezentace na téma: "Jak modelovat výsledky náh. pokusů?"— Transkript prezentace:

1 Jak modelovat výsledky náh. pokusů?
Martina Litschmannová, Adéla Vrtková

2 Opakování Základní pojmy z teorie pravděpodobnosti
Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž probíhá. Co je to náhodný jev? Tvrzení o výsledku náhodného pokusu, přičemž o pravdivosti tohoto tvrzení lze po ukončení pokusu rozhodnout.

3 Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … výsledek hodu kostkou Náhodná veličina je zobrazení, které každému elementárnímu jevu 𝜔∈Ω přiřazuje reálné číslo. Náhodný pokus: Hod kostkou Náhodný jev: Padne sudé číslo. 𝑋∈ 2;4;6

4 Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … teplota měřena na určitém místě v určitý čas (°C) Náhodný pokus: Měření teploty na určitém místě v určitý čas. Náhodný jev: Zjištěná teplota bude větší než 3°C. 𝑋>3

5 Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … doba do remise onemocnění Náhodný pokus: Pozorování doby do remise onemocnění Náhodný jev: Doba do remise nepřekročí 60 měsíců. 𝑋≤60

6 Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … roční mzda jednotlivých občanů (euro) Náhodný pokus: Zjišťování příjmů jednotlivých občanů Náhodný jev: Roční mzda občana nepřekročí euro. 𝑋≤10 000

7 Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu POZOR! Číselně vyjádření lze použít i u veličin, které nejsou kvantitativní ze své podstaty (např. pohlaví – muž (0), žena (1)).

8 K čemu potřebujeme popisovat chování náhodné veličiny?
Neznámá populace Model populace vytváření modelu cílové populace

9 Jak popsat chování náhodné veličiny?
Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jak zadat rozdělení pravděpodobnosti? funkci zadanou analyticky, výčtem hodnot NV a příslušných pravděpodobností.

10 Jak popsat chování náhodné veličiny?
Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jaké zadat rozdělení pravděpodobnosti? distribuční funkcí, pravděpodobnostní funkcí (diskrétní NV), hustotou pravděpodobnosti (spojitá NV).

11 Distribuční funkce 𝐹(𝑥)
Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina 𝑋 bude menší než dané reálné číslo t. 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!

12 Distribuční funkce Ukázka distribuční funkce diskrétní náhodné veličiny Ukázka distribuční funkce spojité náhodné veličiny

13 Základní typy náhodných veličin
Diskrétní NV – mohou nabývat spočetně mnoha hodnot Příklady: počet vadných výrobků z 20 testovaných, počet pokusů do úspěšného navázání spojení, počet požadavků ve frontě, počet měření zatížených hrubou chybou, … Spojité NV – mohou nabývat všech hodnot na nějakém intervalu (mají spojitou distribuční funkci) Příklady: doba obsluhy, chyba měření, výška, hmotnost, osvětlení, napětí v síti, …

14 Základní typy náhodných veličin
Diskrétní náhodná veličina (dále DNV) může nabývat spočetně mnoha hodnot DNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována pravděpodobnostní funkcí 𝑃 𝑋= 𝑥 𝑖 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑋= 𝑥 𝑖 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Spojitá náhodná veličina (dále SNV) může nabývat všech hodnot na nějakém intervalu (má spojitou distribuční funkci) SNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována hustotou pravděpodobností 𝑓 𝑥 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥

15 Rozdělení pravděpodobnosti diskrétní náhodné veličiny

16 Diskrétní náhodná veličina
Definice Náhodná veličina X má diskrétní rozdělení pravděpodobnosti (zkráceně: „je diskrétní“) právě když nabývá spočetně mnoha hodnot. DNV lze charakterizovat: pravděpodobnostní funkcí, distribuční funkcí

17 Pravděpodobnostní funkce
𝑃 𝑥 𝑖 ≥0 𝑖 𝑃 𝑋= 𝑥 𝑖 =1 Lze zadat: předpisem, ∀𝑥∈ 0;1;2 :𝑃 𝑋=𝑥 = 2 𝑥 ∙ 0,33 𝑥 ∙ 0,67 3−𝑥 tabulkou, grafem. 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000

18 1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači 𝑝 … pravděpodobnost, že na počítači je nainstalován nelegální software, 𝑝=0,33 𝑃 𝑋=0 = 1−𝑝 ∙ 1−𝑝 ≅0,449 𝑃 𝑋=2 =𝑝∙𝑝=0,109 𝑃 𝑋=1 =1− 𝑝 2 − 1−𝑝 2 ≅0,442 (nebo 𝑃 𝑋=1 =𝑝∙ 1−𝑝 + 1−𝑝 ∙𝑝) 𝑥 1 2 celkem 𝑃(𝑥) 1,000

19 1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači 𝑝 … pravděpodobnost, že na počítači je nainstalován nelegální software, 𝑝=0,33 𝑃 𝑋=0 = 1−𝑝 ∙ 1−𝑝 ≅0,449 𝑃 𝑋=2 =𝑝∙𝑝=0,109 𝑃 𝑋=1 =1− 𝑝 2 − 1−𝑝 2 ≅0,442 (nebo 𝑃 𝑋=1 =𝑝∙ 1−𝑝 + 1−𝑝 ∙𝑝) 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000

20 1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Distribuční funkce: ? 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000

21 Vztah mezi pravděpodobnostní a distribuční funkcí

22 Vztah mezi pravděpodobnostní a distribuční funkci
Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

23 Vztah mezi pravděpodobnostní a distribuční funkci
Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

24 Vztah mezi pravděpodobnostní a distribuční funkci
Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 („=velikost skoku v bodě a“)

25 Vztah mezi pravděpodobnostní a distribuční funkci
𝟎,𝟒𝟒𝟐 𝟎,𝟒𝟒𝟐 Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 („=velikost skoku v bodě a“)

26 Vztah mezi pravděpodobnosti a distribuční funkci
𝟎,𝟒𝟒𝟐 𝟎,𝟒𝟒𝟐 Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 , tj. velikost „skoku“ distribuční funkce v bodech nespojitosti je rovna příslušným hodnotám pravděpodobnostní funkce.

27 1 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙 −∞; 0 0; 1 1; 2 2;∞ 𝑭(𝒙) 0,000 0,449 0, 891 1,000

28 Distribuční funkce 𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem,
𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem, tabulkou, grafem. 𝐹 𝑥 = 0 , 𝑥≤0 0, <𝑥≤1 0, <𝑥≤2 1, <𝑥 𝑥 −∞; 0 0; 1 1; 2 2;∞ 𝐹(𝑥) 0,000 0,449 0, 891 1,000

29 Distribuční funkce 𝐹(𝑥)
Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina X bude menší než dané reálné číslo t. Vlastnosti distribuční funkce: 0≤𝐹 𝑡 ≤1, je neklesající, je zleva spojitá, má nejvýše spočetně mnoho bodů nespojitosti, lim 𝑡→−∞ 𝐹 𝑡 =0 („začíná“ v 0), lim 𝑡→∞ 𝐹 𝑡 =1 („končí“ v 1). 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!

30 Vztah mezi pravděpodobnosti a distribuční funkcí
𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎

31 Vztah mezi pravděpodobnosti a distribuční funkcí
𝑃 𝑋<𝑎 =𝐹 𝑎 = 𝑥 𝑖 <𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 = 𝑥 𝑖 ≥𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = 𝑎≤𝑥 𝑖 <𝑏 𝑃( 𝑥 𝑖 ) 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹(𝑎) .

32 2 Počet počítačů s nelegálním softwarem (ze 2 testovaných) lze modelovat náhodnou veličinou s distribuční funkci 𝐹 𝑥 = 0,000, 𝑥∈ −∞; 0 0,449, 𝑥∈ 0; 1 0,891, 𝑥∈ 1; 2 1,000, 𝑥∈ 2;∞ . Určete pravděpodobnostní funkci dané náhodné veličiny. 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000

33 Rozdělení pravděpodobnosti spojité náhodné veličiny

34 Spojitá náhodná veličina
Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí Proč se pro popis SNV nepoužívá pravděpodobnostní funkce?

35 Spojitá náhodná veličina
Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí SNV má spojitou distribuční funkci a proto: ∀𝑥∈ℝ:𝑃 𝑥 =0

36 Hustota pravděpodobnosti 𝑓(𝑥)
𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥 ⇒ 𝑓 𝑥 = 𝑑𝐹 𝑑𝑥 Vlastnosti hustoty pravděpodobnosti 𝑓 𝑥 je reálná nezáporná funkce, −∞ ∞ 𝑓 𝑥 =1 (plocha pod křivkou hustoty je 1), lim 𝑥→−∞ 𝑓 𝑥 =0 („začíná v 0“), lim 𝑥→∞ 𝑓 𝑥 =0 („končí v 0“) 𝑓(𝑥) může nabývat hodnot vyšších než 1!!!

37 Distribuční funkce 𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥

38 Vztah mezi pravděpodobností a distribuční funkcí

39 Vztah mezi pravděpodobnosti, hustotou a distr. funkcí
𝑃 𝑋<𝑎 =𝐹 𝑎 = −∞ 𝑎 𝑓 𝑥 𝑑𝑥 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 =1− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 ∞ 𝑓 𝑥 𝑑𝑥 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = = −∞ 𝑏 𝑓 𝑥 𝑑𝑥− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 𝑏 𝑓 𝑥 𝑑𝑥 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎 =0 Je-li náhodná veličina X spojitá, pak lze ve výše uvedených nerovnostech zaměňovat symboly ostré a neostré nerovnosti, tj. 𝑃 𝑋<𝑎 =𝑃 𝑋≤𝑎 apod.

40 Určete distribuční funkci 𝐹 𝑥 .
3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 𝑐, 𝑥∈ 0;10 0, 𝑥∉ 0;10 Určete konstantu 𝑐. Určete distribuční funkci 𝐹 𝑥 . Určete pravděpodobnost, že cestující bude čekat nejvýše 5 minut; alespoň 3 minuty; právě 7 minut.

41 3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞

42 3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞

43 3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞

44 3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 0,1, 𝑥∈ 0;10 0, 𝑥∉ 0;10 . 𝐹 𝑥 = 0, 𝑥∈ −∞;0 0,1𝑥, 𝑥∈ 0;10 1, 𝑥∈ 0;∞ 𝑃 𝑋=7 =0

45 Číselné charakteristiky náhodných veličin

46 Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota Kvantily Modus Míry variability Rozptyl Směrodatná odchylka Variační koeficient Míry šikmosti a špičatosti Šikmost Špičatost

47 Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ)   pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥

48 Význam střední hodnoty
DNV - Střední hodnota je formou váženého průměru možných hodnot s váhami odpovídajícími jejich pravděpodobnostem. Střední hodnota ≈ těžiště 𝐸 𝑋 =𝜇= (𝑖) 𝑥 𝑖 ∙𝑃 𝑥 𝑖 možné hodnoty váhy E(X) E(X)

49 Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ)   pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥 Kvantily (angl. quantiles; 100𝑝% kvantil (𝑝-kvantil) se značí 𝑥 𝑝 ) 𝑃 𝑋< 𝑥 𝑝 =𝑝⇒𝐹 𝑥 𝑝 =𝑝 ⇒ 𝑥 𝑝 = 𝐹 −1 (𝑝) Kvantily se obvykle určují pouze pro SNV.

50 Význačné kvantily Kvartily Dolní kvartil 𝑥 0,25 Medián 𝑥 0,5
Horní kvartil 𝑥 0,75 Decily – 𝑥 0,1 ; 𝑥 0,2 ; ... ; 𝑥 0,9 Percentily – 𝑥 0,01 ; 𝑥 0,02 ; …; 𝑥 0,03 Minimum 𝑥 𝑚𝑖𝑛 a Maximum 𝑥 𝑚𝑎𝑥

51 Kde se setkáme s kvantily?

52 Číselné charakteristiky náhodných veličin
Míry polohy (úrovně) Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ)   pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥 Kvantily (angl. quantiles; 100𝑝% kvantil (𝑝-kvantil) se značí 𝑥 𝑝 ) 𝑃 𝑋< 𝑥 𝑝 =𝑝⇒𝐹 𝑥 𝑝 =𝑝 ⇒ 𝑥 𝑝 = 𝐹 −1 (𝑝) Modus (angl. mode; značí se 𝑋 ) pro diskrétní NV: ∀ 𝑥 𝑖 : 𝑃 𝑋= 𝑋 ≥𝑃 𝑋= 𝑥 𝑖 pro spojitou NV: ∀𝑥: 𝑓 𝑋 ≥𝑓 𝑥

53 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. E 𝑋 = 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000

54 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. E 𝑋 = 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660

55 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. E 𝑋 = 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 =𝟎,𝟔𝟔𝟎 𝑋 =𝟎 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660

56 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete střední hodnotu a modus počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. Při kontrole 2 počítačů lze očekávat průměrně 0,660 počítačů s nelegálním softwarem. Obvykle (nejčastěji) však lze očekávat, že žádný ze 2 kontrolovaných počítačů nebude mít nainstalován nelegální software. 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660

57 Číselné charakteristiky náhodných veličin
Míry variability Rozptyl (angl. dispersion, variance; značí se 𝐷 𝑋 )   pro diskrétní NV: D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 pro spojitou NV: D 𝑋 = −∞ ∞ 𝑥 2 ∙𝑓 𝑥 𝑑𝑥 − 𝐸 𝑋 2

58 Význam rozptylu Rozptyl ≈ Variabilita dat kolem střední hodnoty
𝑫 𝑿𝟏 <𝑫(𝑿𝟐) Jednotka rozptylu je kvadrátem jednotky náhodné veličiny!!! Tato nevýhoda rozptylu je důvodem zavedení směrodatné odchylky.

59 Číselné charakteristiky náhodných veličin
Míry variability Rozptyl (angl. dispersion, variance; značí se 𝐷 𝑋 )   pro diskrétní NV: D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 pro spojitou NV: D 𝑋 = −∞ ∞ 𝑥 2 ∙𝑓 𝑥 𝑑𝑥 − 𝐸 𝑋 2 Směrodatná odchylka (angl. standard deviation; značí se 𝜎 𝑋 ) 𝜎(𝑋)= 𝐷(𝑋)

60 Směrodatná odchylka Směrodatná odchylka 𝝈
Jakou představu o náhodné veličině X si lze udělat na základě její stř. hodnoty 𝜇 a sm. odchylky 𝜎? Směrodatná odchylka neumožňuje srovnávat variabilitu náhodných veličin měřených v různých jednotkách! Proto zavádíme var. koeficient. 𝜎(𝑋)= 𝐷(𝑋) ∀𝑘>0:𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 (Čebyševova nerovnost) k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 >0 2 >0,75 3 >0,89

61 Číselné charakteristiky náhodných veličin
Míry variability Rozptyl (angl. dispersion, variance; značí se 𝐷 𝑋 )   pro diskrétní NV: D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 pro spojitou NV: D 𝑋 = −∞ ∞ 𝑥 2 ∙𝑓 𝑥 𝑑𝑥 − 𝐸 𝑋 2 Směrodatná odchylka (angl. standard deviation; značí se 𝜎 𝑋 ) 𝜎(𝑋)= 𝐷(𝑋) Variační koeficient (angl. coefficient of variation; značí se C𝑉 𝑋 ) 𝐶𝑉= 𝜎 𝜇 , resp. 𝜎 𝜇 ∙100 (%) Var. koef. 𝑪𝑽 je definován pouze pro nezáporné náhodné veličiny!

62 Variační koeficient Variační koeficient 𝑪𝑽 je definován pouze pro nezáporné náhodné veličiny. Variační koeficient – směrodatná odchylka v procentech střední hodnoty Čím nižší var. koeficient, tím homogennější soubor. 𝐶𝑉>0,5 ⇒ mluvíme o silně rozptýlené náhodné veličině. 𝐶𝑉= 𝜎 𝜇 , resp. 𝜎 𝜇 ∙100 (%)

63 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660

64 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660 𝒙 𝟐 ∙𝑷(𝒙) 0,436 0,878

65 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 = 𝑖 𝑥 𝑖 2 ∙𝑃 𝑥 𝑖 − 𝐸 𝑋 2 =0,878− 0,660 2 ≅𝟎,𝟒𝟒𝟐 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660 𝒙 𝟐 ∙𝑷(𝒙) 0,436 0,878

66 4 Bylo zjištěno, že nelegální software se vyskytuje na 33% počítačů. Určete pravděpodobnostní a distribuční funkci počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. 𝑋 … počet počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači Určete rozptyl, směrodatnou odchylku a variační koeficient počtu počítačů s nelegálním softwarem mezi 2 kontrolovanými počítači. D 𝑋 ≅𝟎,𝟒𝟒𝟐, 𝜎 𝑋 = 𝐷(𝑋) ≅𝟎,𝟔𝟔𝟓 , 𝐶𝑉 𝑋 = 𝜎 𝑋 𝜇 = 0,665 0,660 =𝟏,𝟎𝟎𝟖 𝒙 1 2 celkem 𝑷(𝒙) 0,449 0,442 0,109 1,000 𝒙∙𝑷(𝒙) 0,000 0,218 0,660 𝒙 𝟐 ∙𝑷(𝒙) 0,436 0,878

67 Číselné charakteristiky náhodných veličin
Míry šikmosti a špičatosti Šikmost (angl. skewness) Špičatost (angl. kurtosis)

68 Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin?
Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.

69 pozitivně zešikmené rozdělení
Šikmost 𝛼 3 Míra symetrie rozdělení NV x f(x) x f(x) x f(x) 𝛼 3 <0 negativně zešikmené rozdělení 𝛼 3 =0 symetrické rozdělení 𝛼 3 >0 pozitivně zešikmené rozdělení 𝐸(𝑋)< 𝑥 0,5 < 𝑥 𝑥 = 𝑥 0,5 =𝐸(𝑋) 𝑥 < 𝑥 0,5 <𝐸(𝑋) obvykle

70 Špičatost 𝛼 4 x f(x) x f(x) x f(x) míra koncentrace kolem průměru
standardizovaná špičatost 𝛼 4 −3 x f(x) x f(x) x f(x) 𝛼 4 <3 špičatost menší než u norm. rozdělení (plošší rozdělení) 𝛼 4 =3 špičatost odpovídající normálnímu rozdělení 𝛼 4 >3 špičatost větší než u norm. rozdělení (špičatější rozdělení)

71 Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin?
Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g1, angl. skewness) a špičatost (g2, angl. kurtosis).

72 Literatura Litschmannová, M. (2012), Vybrané kapitoly z pravděpodobnosti, elektronická skripta a doplňkové interaktivní materiály (kapitola Úvod do teorie pravděpodobnosti) Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN (kapitola 3)

73 DěkujEME za pozornost!


Stáhnout ppt "Jak modelovat výsledky náh. pokusů?"

Podobné prezentace


Reklamy Google