Jak modelovat výsledky náh. pokusů? Martina Litschmannová
Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž probíhá. Co je to náhodný jev? Tvrzení o výsledku náhodného pokusu, přičemž o pravdivosti tohoto tvrzení lze po ukončení pokusu rozhodnout.
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … výsledek hodu kostkou Náhodný pokus: Hod kostkou Náhodný jev: Padne sudé číslo. 𝑋∈ 2;4;6
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … počet dívek mezi 1000 náhodně vybranými dětmi Náhodný pokus: Náhodný výběr 1000 dětí a zjištění počtu dívek mezi nimi. Náhodný jev: Mezi 1000 náhodně vybranými dětmi bude více než 500 dívek. 𝑋>500
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … doba do remise onemocnění Náhodný pokus: Pozorování doby do remise onemocnění Náhodný jev: Doba do remise nepřekročí 60 měsíců. 𝑋≤60
Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu POZOR! Číselně vyjádření lze použít i u veličin, které nejsou kvantitativní ze své podstaty (např. pohlaví – muž (0), žena (1)).
K čemu potřebujeme popisovat chování náhodné veličiny? Neznámá populace Model populace vytváření modelu cílové populace
Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jak zadat rozdělení pravděpodobnosti? funkci zadanou analyticky, výčtem hodnot NV a příslušných pravděpodobností.
Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jaké zadat rozdělení pravděpodobnosti? distribuční funkcí, pravděpodobnostní funkcí (diskrétní NV), hustotou pravděpodobnosti (spojitá NV).
Distribuční funkce 𝐹(𝑥) Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina 𝑋 bude menší než dané reálné číslo t. 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!
Distribuční funkce Ukázka distribuční funkce diskrétní náhodné veličiny Ukázka distribuční funkce spojité náhodné veličiny
Základní typy náhodných veličin Diskrétní NV – mohou nabývat spočetně mnoha hodnot Příklady: počet dní hospitalizace, počet krvácivých epizod, počet dní nemocenské, počet zákazníků v lékárně během jednoho dne, … Spojité NV – mohou nabývat všech hodnot na nějakém intervalu (mají spojitou distribuční funkci) Příklady: doba do remise onemocnění, výška, váha, BMI, IQ, vitální kapacita plic, chyba měření, …
Základní typy náhodných veličin Diskrétní náhodná veličina (dále DNV) může nabývat spočetně mnoha hodnot DNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována pravděpodobnostní funkcí 𝑃 𝑋= 𝑥 𝑖 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑋= 𝑥 𝑖 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Spojitá náhodná veličina (dále SNV) může nabývat všech hodnot na nějakém intervalu (má spojitou distribuční funkci) SNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována hustotou pravděpodobností 𝑓 𝑥 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥
Rozdělení pravděpodobnosti diskrétní náhodné veličiny
Diskrétní náhodná veličina Definice Náhodná veličina X má diskrétní rozdělení pravděpodobnosti (zkráceně: „je diskrétní“) právě když nabývá spočetně mnoha hodnot. DNV lze charakterizovat: pravděpodobnostní funkcí, distribuční funkcí
Pravděpodobnostní funkce 𝑃 𝑥 𝑖 ≥0 𝑖 𝑃 𝑋= 𝑥 𝑖 =1 Lze zadat: předpisem, ∀𝑥∈ 0;1;2;3 :𝑃 𝑋=𝑥 = 3 𝑥 ∙ 0,1 𝑥 ∙ 0,9 3−𝑥 tabulkou, grafem. x 1 2 3 𝑃 𝑥 0,729 0,243 0,027 0,001
1 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Vylučovatelství skupinově specifických substancí ABH Určete pravděpodobnostní a distribuční funkci počtu alel Se. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2
Vztah mezi pravděpodobnostní a distribuční funkcí
Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.
Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.
Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.
Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 („=velikost skoku v bodě a“)
Vztah mezi pravděpodobnosti a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 , tj. velikost „skoku“ distribuční funkce v bodech nespojitosti je rovna příslušným hodnotám pravděpodobnostní funkce.
Distribuční funkce 𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem, 𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem, tabulkou, grafem. x F( x ) −∞; 0 0; 1 0,729 1; 2 0,972 2; 3 0,999 3; ∞ 1 𝐹 𝑥 = 0 𝑥≤0 0,729 0<𝑥≤1 0,972 1<𝑥≤2 0,999 2<𝑥≤3 1 3<𝑥≤∞
Distribuční funkce 𝐹(𝑥) Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina X bude menší než dané reálné číslo t. Vlastnosti distribuční funkce: 0≤𝐹 𝑡 ≤1, je neklesající, je zleva spojitá, má nejvýše spočetně mnoho bodů nespojitosti, 𝐹 𝑡 →0 𝑝𝑟𝑜 𝑡→−∞ („začíná“ v 0), 𝐹 𝑡 →1 𝑝𝑟𝑜 𝑡→∞ („končí“ v 1). 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!
Vztah mezi pravděpodobnosti a distribuční funkcí 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎
Vztah mezi pravděpodobnosti a distribuční funkcí 𝑃 𝑋<𝑎 =𝐹 𝑎 = 𝑥 𝑖 <𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 = 𝑥 𝑖 ≥𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = 𝑎≤𝑥 𝑖 <𝑏 𝑃( 𝑥 𝑖 ) 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹(𝑎) . Umíte určit distribuční funkci, znáte-li funkci pravděpodobnostní? Ověřit si to můžete ZDE.
2 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). Počet alelol Se lze modelovat náhodnou veličinou s distribuční funkcí 𝐹 𝑥 = 0,00, 𝑥∈ −∞; 0 0,25, 𝑥∈ 0; 1 0,75, 𝑥∈ 1; 2 1,00, 𝑥∈ 2;∞ . Určete pravděpodobnostní funkci počtu alel Se.
Rozdělení pravděpodobnosti spojité náhodné veličiny
Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí Proč se pro popis SNV nepoužívá pravděpodobnostní funkce?
Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí SNV má spojitou distribuční funkci a proto: ∀𝑥∈ℝ:𝑃 𝑥 =0
Hustota pravděpodobnosti 𝑓(𝑥) 𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥 ⇒ 𝑓 𝑥 = 𝑑𝐹 𝑑𝑥 Pozorujte vztah mezi histogramem a grafem hustoty pravděpodobnosti (java applet: Přechod mezi histogramem a hustotou pravděpodobnosti) Vlastnosti hustoty pravděpodobnosti 𝑓 𝑥 je reálná nezáporná funkce, −∞ ∞ 𝑓 𝑥 =1 (plocha pod křivkou hustoty je 1), lim 𝑥→−∞ 𝑓 𝑥 =0 („začíná v 0“), lim 𝑥→∞ 𝑓 𝑥 =0 („končí v 0“) 𝑓(𝑥) může nabývat hodnot vyšších než 1!!!
Distribuční funkce 𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥
Vztah mezi pravděpodobností a distribuční funkcí
Vztah mezi pravděpodobnosti, hustotou a distr. funkcí 𝑃 𝑋<𝑎 =𝐹 𝑎 = −∞ 𝑎 𝑓 𝑥 𝑑𝑥 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 =1− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 ∞ 𝑓 𝑥 𝑑𝑥 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = = −∞ 𝑏 𝑓 𝑥 𝑑𝑥− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 𝑏 𝑓 𝑥 𝑑𝑥 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎 =0 Je-li náhodná veličina X spojitá, pak lze ve výše uvedených nerovnostech zaměňovat symboly ostré a neostré nerovnosti, tj. 𝑃 𝑋<𝑎 =𝑃 𝑋≤𝑎 apod. Jaká je souvislost mezi pravděpodobností, distr. funkcí a hustotou pravd.? Ověřit si, zda je Vaše geometrická představa správná, můžete ZDE.
Určete distribuční funkci 𝐹 𝑥 . 3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 𝑐, 𝑥∈ 0;10 0, 𝑥∉ 0;10 Určete konstantu 𝑐. Určete distribuční funkci 𝐹 𝑥 . b) Určete pravděpodobnost, že cestující bude čekat nejvýše 5 minut; alespoň 3 minuty; právě 7 minut.
Číselné charakteristiky náhodných veličin
Číselné charakteristiky náhodných veličin Obecný moment r-tého řádu (značí se 𝜇 𝑟 nebo 𝐸 𝑋 𝑟 pro 𝑟=1, 2, …) pro diskrétní NV: 𝜇 𝑟 = 𝑖 𝑥 𝑖 𝑟 ∙𝑃 𝑥 𝑖 pro spojitou NV: 𝜇 𝑟 = −∞ ∞ 𝑥 𝑟 ∙𝑓 𝑥 𝑑𝑥 Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ) pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥
Význam střední hodnoty DNV - Střední hodnota je formou váženého průměru možných hodnot s váhami odpovídajícími jejich pravděpodobnostem. Střední hodnota ≈ těžiště 𝐸 𝑋 =𝜇= (𝑖) 𝑥 𝑖 ∙𝑃 𝑥 𝑖 možné hodnoty váhy E(X) E(X)
Kvantily p-kvantil 𝒙 𝒑 (také 100p%-ní kvantil je číslo, pro které platí: ⇒𝐹 𝑥 𝑝 =𝑝 ⇒ 𝑥 𝑝 = 𝐹 −1 (𝑝) (tj. kvantilová funkce 𝐹 −1 (𝑝) je funkcí inverzní k distribuční funkci 𝐹 𝑥 𝑝 ) Kvantily obvykle určujeme pouze pro SNV. 𝑃 𝑋< 𝑥 𝑝 =𝑝.
Význačné kvantily Kvartily Dolní kvartil 𝑥 0,25 Medián 𝑥 0,5 Horní kvartil 𝑥 0,75 Decily – 𝑥 0,1 ; 𝑥 0,2 ; ... ; 𝑥 0,9 Percentily – 𝑥 0,01 ; 𝑥 0,02 ; …; 𝑥 0,03 Minimum 𝑥 𝑚𝑖𝑛 a Maximum 𝑥 𝑚𝑎𝑥
Kde se setkáme s kvantily?
Modus Modus 𝒙 – typická hodnota náhodné veličiny pro diskrétní NV: ∀ 𝑥 𝑖 : 𝑃 𝑋= 𝑥 ≥𝑃 𝑋= 𝑥 𝑖 (tzn. modus je taková hodnota DNV, v níž 𝑃 𝑥 𝑖 nabývá svého maxima) pro spojitou NV: ∀𝑥: 𝑓 𝑥 ≥𝑓 𝑥 (tzn. modus je taková hodnota SNV, v níž 𝑓 𝑥 nabývá svého maxima) Modus není těmito podmínkami určen jednoznačně, tzn. náhodná veličina může mít několik modů (např. výsledek hodu kostkou). Má-li NV právě jeden modus, mluvíme o unimodálním rozdělení NV. Má-li NV unimodální symetrické rozdělení, pak 𝐸 𝑋 = 𝑥 0,5 = 𝑥 .
4 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Vylučovatelství skupinově specifických substancí ABH Určete střední hodnotu a modus počtu alel Se. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2
Číselné charakteristiky náhodných veličin Centrální moment r-tého řádu 𝝁 𝒓 ´ (značíme 𝜇 𝑟 ´=𝐸 𝑋−𝐸𝑋 𝑟 ) pro diskrétní NV: 𝜇 𝑟 ´= 𝑖 𝑥 𝑖 −𝐸𝑋 𝑟 ∙𝑃 𝑥 𝑖 pro spojitou NV: 𝜇 𝑟 ´= −∞ ∞ 𝑥−𝐸𝑋 𝑟 ∙𝑓 𝑥 𝑑𝑥 Rozptyl (angl. dispersion, variance; značí se 𝜇 2 ´ nebo 𝐷𝑋 nebo 𝜎 2 ) pro diskrétní NV: 𝐷 𝑋 =𝜇 2 ´= 𝑖 𝑥 𝑖 −𝐸𝑋 2 ∙𝑃 𝑥 𝑖 pro spojitou NV: 𝐷 𝑋 =𝜇 2 ´= −∞ ∞ 𝑥−𝐸𝑋 2 ∙𝑓 𝑥 𝑑𝑥 Výpočetní vztah pro rozptyl: 𝐷(𝑋)= 𝐸(𝑋 2 )− 𝐸𝑋 2
Význam rozptylu Rozptyl ≈ Variabilita dat kolem střední hodnoty (rozsah) 𝑫 𝑿𝟏 <𝑫(𝑿𝟐) Jednotka rozptylu je kvadrátem jednotky náhodné veličiny!!! Tato nevýhoda rozptylu je důvodem zavedení směrodatné odchylky.
Směrodatná odchylka Směrodatná odchylka 𝝈 Jakou představu o náhodné veličině X si lze udělat na základě její stř. hodnoty 𝜇 a sm. odchylky 𝜎? Směrodatná odchylka neumožňuje srovnávat variabilitu náhodných veličin měřených v různých jednotkách! Proto zavádíme var. koeficient. 𝜎(𝑌)= 𝐷(𝑋) ∀𝑘>0:𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 (Čebyševova nerovnost) k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 >0 2 >0,75 3 >0,89
Variační koeficient Variační koeficient 𝜸 je definován pouze pro nezáporné náhodné veličiny. Variační koeficient – směrodatná odchylka v procentech střední hodnoty Čím nižší var. koeficient, tím homogennější soubor. 𝛾 > 50% značí silně rozptýlený soubor. 𝛾= 𝜎 𝜇 , resp. 𝜎 𝜇 ∙100 (%)
5 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Vylučovatelství skupinově specifických substancí ABH Určete rozptyl, směrodatnou odchylku a variační koeficient počtu alel Se. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2
Modelujeme výšku chlapců ve věku 3,5 – 4 roky. Vysvětlete: 6 Modelujeme výšku chlapců ve věku 3,5 – 4 roky. Vysvětlete: 2% kvantil modelované náhodné veličiny je 93 cm. Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. V jakém rozpětí lze očekávat výšku chlapců ve věku 3,5 – 4 roky? Pro interpretaci využijte Čebyševovu nerovnost. Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. Posuďte variabilitu modelované NV. (Není příliš vysoká? Pro posouzení použijte variační koeficient.) Víme, že pro distribuční funkci modelované NV platí: 𝐹 111 =0,98. Co jsme se dozvěděli?
Míry šikmosti a špičatosti
Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.
pozitivně zešikmené rozdělení Šikmost 𝛼 3 Míra symetrie rozdělení NV 𝛼 3 = 𝜇 3 ′ 𝜎 3 = 𝐸 𝑋−𝐸(𝑋) 3 𝜎 3 x f(x) x f(x) x f(x) 𝛼 3 <0 negativně zešikmené rozdělení 𝛼 3 =0 symetrické rozdělení 𝛼 3 >0 pozitivně zešikmené rozdělení 𝐸(𝑋)< 𝑥 0,5 < 𝑥 𝑥 = 𝑥 0,5 =𝐸(𝑋) 𝑥 < 𝑥 0,5 <𝐸(𝑋) obvykle
Špičatost 𝛼 4 𝛼 4 = 𝜇 4 ′ 𝜎 4 = 𝐸 𝑋−𝐸(𝑋) 4 𝜎 4 x f(x) x f(x) x f(x) míra koncentrace kolem průměru standardizovaná špičatost 𝛼 4 −3 𝛼 4 = 𝜇 4 ′ 𝜎 4 = 𝐸 𝑋−𝐸(𝑋) 4 𝜎 4 x f(x) x f(x) x f(x) 𝛼 4 <3 špičatost menší než u norm. rozdělení (plošší rozdělení) 𝛼 4 =3 špičatost odpovídající normálnímu rozdělení 𝛼 4 >3 špičatost větší než u norm. rozdělení (špičatější rozdělení)
Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g1, angl. skewness) a špičatost (g2, angl. kurtosis).
Literatura Litschmannová, M. (2012), Vybrané kapitoly z pravděpodobnosti, elektronická skripta a doplňkové interaktivní materiály (kapitola Úvod do teorie pravděpodobnosti) Zvárová, J. (1999), Základy statistiky pro biomedicínské obory, dostupné on-line: http://new.euromise.org/czech/tajne/ucebnice/html/html/statist.html (kapitola 4) Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN 978- 80-7204-782-6 (kapitola 3)
Děkuji za pozornost!