Jak modelovat výsledky náh. pokusů?

Slides:



Advertisements
Podobné prezentace
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Advertisements

Ekonomicko-matematické metody č. 11 Prof. RNDr. Jaroslav Ramík, CSc.
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
Význam diferenciálních rovnic převzato od Doc. Rapanta.
Petr Kielar Seminář o stavebním spoření Část VI: Podmínka rovnováhy a SKLV.
Statistika Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Induktivní statistika
POČET PRAVDĚPODOBNOSTI
Náhodná veličina je veličina, která při opakování náhodného pokusu mění své hodnoty v závislosti na náhodě Náhodné veličiny označujeme X, Y, Z, ... hodnoty.
Interpolace funkčních závislostí
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
Řešení nerovnic Lineární nerovnice
Základní škola Děčín VI, Na Stráni 879/2 – příspěvková organizace
ČÍSLO PROJEKTU CZ.1.07/1.5.00/ ČÍSLO MATERIÁLU 1 – Množiny – teorie
STATISTICKÉ METODY V GEOGRAFII
Statistické pojmy. Statistické pojmy Statistika - vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Pojem statistika slouží k.
Obecné a centrální momenty
„Svět se skládá z atomů“
Charakteristiky variability
Charakteristiky variability
Výběrové metody (Výběrová šetření)
ASTAc/01 Biostatistika 2. cvičení
Základy zpracování geologických dat testování statistických hypotéz
Vybraná rozdělení pravděpodobnosti
Poměr Co je poměr. Změna v daném poměru..
Základy infinitezimálního počtu
Popisná /deskriptivní/ statistika
SIMULAČNÍ MODELY.
Poměr v základním tvaru.
Základy statistické indukce
Molekulová fyzika 3. prezentace.
4.1 – 4.3 Lineární nerovnice i jednoduchý podílový tvar
Obchodní akademie, Střední odborná škola a Jazyková škola s právem státní jazykové zkoušky, Hradec Králové Autor: Mgr. Lubomíra Moravcová Název materiálu:
Parametry polohy Modus Medián
GENEROVÁNÍ HODNOT NÁHODNÝCH VELICIN PSEUDONÁHODNÁ ČÍSLA
APLIKACE MATEMATIKY A FYZIKY A Matematická část 2
Kvadratické nerovnice
V.a1 Teoretické pozadí statistické analýzy
Řešení nerovnic Lineární nerovnice
Spojité VELIČINY Vyšetřování normality dat
Rovnice základní pojmy.
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Jevy a náhodná veličina
STATISTIKA Exaktní věda Úkoly statistiky zjišťovat data
XII. Binomické rozložení
Základní statistické pojmy
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Lineární regrese.
Cauchyho rozdělení spojité náhodné veličiny
* Funkce Matematika – 9. ročník *.
Poměr v základním tvaru.
Příklad 4.1 M\DG ∑
Běžná pravděpodobnostní rozdělení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
Náhodný jev, náhodná proměnná
Centrální limitní věta
Lineární funkce a její vlastnosti
Základy infinitezimálního počtu
Více náhodných veličin
… jak přesně počítat s nepřesnými čísly
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
Konstrukce trojúhelníku
Transkript prezentace:

Jak modelovat výsledky náh. pokusů? Martina Litschmannová

Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž probíhá. Co je to náhodný jev? Tvrzení o výsledku náhodného pokusu, přičemž o pravdivosti tohoto tvrzení lze po ukončení pokusu rozhodnout.

Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … výsledek hodu kostkou Náhodný pokus: Hod kostkou Náhodný jev: Padne sudé číslo. 𝑋∈ 2;4;6

Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … počet dívek mezi 1000 náhodně vybranými dětmi Náhodný pokus: Náhodný výběr 1000 dětí a zjištění počtu dívek mezi nimi. Náhodný jev: Mezi 1000 náhodně vybranými dětmi bude více než 500 dívek. 𝑋>500

Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu 𝑿 … doba do remise onemocnění Náhodný pokus: Pozorování doby do remise onemocnění Náhodný jev: Doba do remise nepřekročí 60 měsíců. 𝑋≤60

Náhodná veličina (NV) Náhodná veličina – číselné vyjádření výsledku náhodného pokusu POZOR! Číselně vyjádření lze použít i u veličin, které nejsou kvantitativní ze své podstaty (např. pohlaví – muž (0), žena (1)).

K čemu potřebujeme popisovat chování náhodné veličiny? Neznámá populace Model populace vytváření modelu cílové populace

Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jak zadat rozdělení pravděpodobnosti? funkci zadanou analyticky, výčtem hodnot NV a příslušných pravděpodobností.

Jak popsat chování náhodné veličiny? Rozdělení pravděpodobnosti náhodné veličiny - předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ. (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ) Jaké zadat rozdělení pravděpodobnosti? distribuční funkcí, pravděpodobnostní funkcí (diskrétní NV), hustotou pravděpodobnosti (spojitá NV).

Distribuční funkce 𝐹(𝑥) Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina 𝑋 bude menší než dané reálné číslo t. 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!

Distribuční funkce Ukázka distribuční funkce diskrétní náhodné veličiny Ukázka distribuční funkce spojité náhodné veličiny

Základní typy náhodných veličin Diskrétní NV – mohou nabývat spočetně mnoha hodnot Příklady: počet dní hospitalizace, počet krvácivých epizod, počet dní nemocenské, počet zákazníků v lékárně během jednoho dne, … Spojité NV – mohou nabývat všech hodnot na nějakém intervalu (mají spojitou distribuční funkci) Příklady: doba do remise onemocnění, výška, váha, BMI, IQ, vitální kapacita plic, chyba měření, …

Základní typy náhodných veličin Diskrétní náhodná veličina (dále DNV) může nabývat spočetně mnoha hodnot DNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována pravděpodobnostní funkcí 𝑃 𝑋= 𝑥 𝑖 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑋= 𝑥 𝑖 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Spojitá náhodná veličina (dále SNV) může nabývat všech hodnot na nějakém intervalu (má spojitou distribuční funkci) SNV 𝑋 s distribuční funkcí 𝐹 𝑋 𝑡 je charakterizována hustotou pravděpodobností 𝑓 𝑥 , tj. funkcí pro níž platí: 𝐹 𝑋 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥

Rozdělení pravděpodobnosti diskrétní náhodné veličiny

Diskrétní náhodná veličina Definice Náhodná veličina X má diskrétní rozdělení pravděpodobnosti (zkráceně: „je diskrétní“) právě když nabývá spočetně mnoha hodnot. DNV lze charakterizovat: pravděpodobnostní funkcí, distribuční funkcí

Pravděpodobnostní funkce 𝑃 𝑥 𝑖 ≥0 𝑖 𝑃 𝑋= 𝑥 𝑖 =1 Lze zadat: předpisem, ∀𝑥∈ 0;1;2;3 :𝑃 𝑋=𝑥 = 3 𝑥 ∙ 0,1 𝑥 ∙ 0,9 3−𝑥 tabulkou, grafem. x 1 2 3 𝑃 𝑥 0,729 0,243 0,027 0,001

1 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Vylučovatelství skupinově specifických substancí ABH Určete pravděpodobnostní a distribuční funkci počtu alel Se. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2

Vztah mezi pravděpodobnostní a distribuční funkcí

Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová.

Vztah mezi pravděpodobnostní a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 („=velikost skoku v bodě a“)

Vztah mezi pravděpodobnosti a distribuční funkci Body nespojitosti distribuční f-ce jsou body, v nichž je pravděpodobnostní f-ce nenulová. 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹(𝑥) −𝐹 𝑎 , tj. velikost „skoku“ distribuční funkce v bodech nespojitosti je rovna příslušným hodnotám pravděpodobnostní funkce.

Distribuční funkce 𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem, 𝐹 𝑡 = 𝑥 𝑖 <𝑡 𝑃 𝑥 𝑖 Lze zadat: předpisem, tabulkou, grafem. x F( x ) −∞; 0 0; 1 0,729 1; 2 0,972 2; 3 0,999 3; ∞ 1 𝐹 𝑥 = 0 𝑥≤0 0,729 0<𝑥≤1 0,972 1<𝑥≤2 0,999 2<𝑥≤3 1 3<𝑥≤∞

Distribuční funkce 𝐹(𝑥) Distribuční funkce 𝐹 𝑡 je pravděpodobnost, že náhodná veličina X bude menší než dané reálné číslo t. Vlastnosti distribuční funkce: 0≤𝐹 𝑡 ≤1, je neklesající, je zleva spojitá, má nejvýše spočetně mnoho bodů nespojitosti, 𝐹 𝑡 →0 𝑝𝑟𝑜 𝑡→−∞ („začíná“ v 0), 𝐹 𝑡 →1 𝑝𝑟𝑜 𝑡→∞ („končí“ v 1). 𝐹 𝑡 =𝑃 𝑋<𝑡 Někteří autoři definuji 𝐹 𝑡 =𝑃 𝑋≤𝑡 ‼!

Vztah mezi pravděpodobnosti a distribuční funkcí 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎

Vztah mezi pravděpodobnosti a distribuční funkcí 𝑃 𝑋<𝑎 =𝐹 𝑎 = 𝑥 𝑖 <𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 = 𝑥 𝑖 ≥𝑎 𝑃( 𝑥 𝑖 ) 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = 𝑎≤𝑥 𝑖 <𝑏 𝑃( 𝑥 𝑖 ) 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹(𝑎) . Umíte určit distribuční funkci, znáte-li funkci pravděpodobnostní? Ověřit si to můžete ZDE.

2 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). Počet alelol Se lze modelovat náhodnou veličinou s distribuční funkcí 𝐹 𝑥 = 0,00, 𝑥∈ −∞; 0 0,25, 𝑥∈ 0; 1 0,75, 𝑥∈ 1; 2 1,00, 𝑥∈ 2;∞ . Určete pravděpodobnostní funkci počtu alel Se.

Rozdělení pravděpodobnosti spojité náhodné veličiny

Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí Proč se pro popis SNV nepoužívá pravděpodobnostní funkce?

Spojitá náhodná veličina Definice Náhodná veličina X má spojité rozdělení pravděpodobnosti (zkráceně: „je spojitá“) právě když má spojitou distribuční funkci. SNV lze charakterizovat: hustotou pravděpodobnosti, distribuční funkcí SNV má spojitou distribuční funkci a proto: ∀𝑥∈ℝ:𝑃 𝑥 =0

Hustota pravděpodobnosti 𝑓(𝑥) 𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥 ⇒ 𝑓 𝑥 = 𝑑𝐹 𝑑𝑥 Pozorujte vztah mezi histogramem a grafem hustoty pravděpodobnosti (java applet: Přechod mezi histogramem a hustotou pravděpodobnosti) Vlastnosti hustoty pravděpodobnosti 𝑓 𝑥 je reálná nezáporná funkce, −∞ ∞ 𝑓 𝑥 =1 (plocha pod křivkou hustoty je 1), lim 𝑥→−∞ 𝑓 𝑥 =0 („začíná v 0“), lim 𝑥→∞ 𝑓 𝑥 =0 („končí v 0“) 𝑓(𝑥) může nabývat hodnot vyšších než 1!!!

Distribuční funkce 𝐹 𝑡 = −∞ 𝑡 𝑓 𝑥 𝑑𝑥

Vztah mezi pravděpodobností a distribuční funkcí

Vztah mezi pravděpodobnosti, hustotou a distr. funkcí 𝑃 𝑋<𝑎 =𝐹 𝑎 = −∞ 𝑎 𝑓 𝑥 𝑑𝑥 𝑃 𝑋≥𝑎 =1−𝑃 𝑋<𝑎 =1−𝐹 𝑎 =1− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 ∞ 𝑓 𝑥 𝑑𝑥 𝑃 𝑎≤𝑋<𝑏 =𝑃 𝑋<𝑏 − 𝑃 𝑋<𝑎 =𝐹 𝑎 −𝐹 𝑏 = = −∞ 𝑏 𝑓 𝑥 𝑑𝑥− −∞ 𝑎 𝑓 𝑥 𝑑𝑥= 𝑎 𝑏 𝑓 𝑥 𝑑𝑥 𝑃 𝑋=𝑎 = lim 𝑥→𝑎+ 𝐹 𝑥 −𝐹 𝑎 =0 Je-li náhodná veličina X spojitá, pak lze ve výše uvedených nerovnostech zaměňovat symboly ostré a neostré nerovnosti, tj. 𝑃 𝑋<𝑎 =𝑃 𝑋≤𝑎 apod. Jaká je souvislost mezi pravděpodobností, distr. funkcí a hustotou pravd.? Ověřit si, zda je Vaše geometrická představa správná, můžete ZDE.

Určete distribuční funkci 𝐹 𝑥 . 3 Tramvaje jezdí v pravidelných intervalech po 10 minutách. Cestující přijde na zastávku v libovolném okamžiku. Náhodná veličina 𝑋 představuje dobu čekání na příjezd tramvaje. Rozdělení dané náhodné veličiny je dáno hustotou pravděpodobností, která je v intervalu 0-10 minut konstantní, mimo tento interval je nulová, tj. 𝑓 𝑥 = 𝑐, 𝑥∈ 0;10 0, 𝑥∉ 0;10 Určete konstantu 𝑐. Určete distribuční funkci 𝐹 𝑥 . b) Určete pravděpodobnost, že cestující bude čekat nejvýše 5 minut; alespoň 3 minuty; právě 7 minut.

Číselné charakteristiky náhodných veličin

Číselné charakteristiky náhodných veličin Obecný moment r-tého řádu (značí se 𝜇 𝑟 nebo 𝐸 𝑋 𝑟 pro 𝑟=1, 2, …) pro diskrétní NV: 𝜇 𝑟 = 𝑖 𝑥 𝑖 𝑟 ∙𝑃 𝑥 𝑖 pro spojitou NV: 𝜇 𝑟 = −∞ ∞ 𝑥 𝑟 ∙𝑓 𝑥 𝑑𝑥 Střední hodnota (angl. expected value, mean; značí se 𝐸 𝑋 nebo µ)   pro diskrétní NV: E 𝑋 =𝜇= 𝑖 𝑥 𝑖 ∙𝑃 𝑥 𝑖 pro spojitou NV: E 𝑋 =𝜇= −∞ ∞ 𝑥∙𝑓 𝑥 𝑑𝑥

Význam střední hodnoty DNV - Střední hodnota je formou váženého průměru možných hodnot s váhami odpovídajícími jejich pravděpodobnostem. Střední hodnota ≈ těžiště 𝐸 𝑋 =𝜇= (𝑖) 𝑥 𝑖 ∙𝑃 𝑥 𝑖 možné hodnoty váhy E(X) E(X)

Kvantily p-kvantil 𝒙 𝒑 (také 100p%-ní kvantil je číslo, pro které platí: ⇒𝐹 𝑥 𝑝 =𝑝 ⇒ 𝑥 𝑝 = 𝐹 −1 (𝑝) (tj. kvantilová funkce 𝐹 −1 (𝑝) je funkcí inverzní k distribuční funkci 𝐹 𝑥 𝑝 ) Kvantily obvykle určujeme pouze pro SNV. 𝑃 𝑋< 𝑥 𝑝 =𝑝.

Význačné kvantily Kvartily Dolní kvartil 𝑥 0,25 Medián 𝑥 0,5 Horní kvartil 𝑥 0,75 Decily – 𝑥 0,1 ; 𝑥 0,2 ; ... ; 𝑥 0,9 Percentily – 𝑥 0,01 ; 𝑥 0,02 ; …; 𝑥 0,03 Minimum 𝑥 𝑚𝑖𝑛 a Maximum 𝑥 𝑚𝑎𝑥

Kde se setkáme s kvantily?

Modus Modus 𝒙 – typická hodnota náhodné veličiny pro diskrétní NV: ∀ 𝑥 𝑖 : 𝑃 𝑋= 𝑥 ≥𝑃 𝑋= 𝑥 𝑖 (tzn. modus je taková hodnota DNV, v níž 𝑃 𝑥 𝑖 nabývá svého maxima) pro spojitou NV: ∀𝑥: 𝑓 𝑥 ≥𝑓 𝑥 (tzn. modus je taková hodnota SNV, v níž 𝑓 𝑥 nabývá svého maxima) Modus není těmito podmínkami určen jednoznačně, tzn. náhodná veličina může mít několik modů (např. výsledek hodu kostkou). Má-li NV právě jeden modus, mluvíme o unimodálním rozdělení NV. Má-li NV unimodální symetrické rozdělení, pak 𝐸 𝑋 = 𝑥 0,5 = 𝑥 .

4 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Vylučovatelství skupinově specifických substancí ABH Určete střední hodnotu a modus počtu alel Se. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2

Číselné charakteristiky náhodných veličin Centrální moment r-tého řádu 𝝁 𝒓 ´ (značíme 𝜇 𝑟 ´=𝐸 𝑋−𝐸𝑋 𝑟 ) pro diskrétní NV: 𝜇 𝑟 ´= 𝑖 𝑥 𝑖 −𝐸𝑋 𝑟 ∙𝑃 𝑥 𝑖 pro spojitou NV: 𝜇 𝑟 ´= −∞ ∞ 𝑥−𝐸𝑋 𝑟 ∙𝑓 𝑥 𝑑𝑥 Rozptyl (angl. dispersion, variance; značí se 𝜇 2 ´ nebo 𝐷𝑋 nebo 𝜎 2 )   pro diskrétní NV: 𝐷 𝑋 =𝜇 2 ´= 𝑖 𝑥 𝑖 −𝐸𝑋 2 ∙𝑃 𝑥 𝑖 pro spojitou NV: 𝐷 𝑋 =𝜇 2 ´= −∞ ∞ 𝑥−𝐸𝑋 2 ∙𝑓 𝑥 𝑑𝑥 Výpočetní vztah pro rozptyl: 𝐷(𝑋)= 𝐸(𝑋 2 )− 𝐸𝑋 2

Význam rozptylu Rozptyl ≈ Variabilita dat kolem střední hodnoty (rozsah) 𝑫 𝑿𝟏 <𝑫(𝑿𝟐) Jednotka rozptylu je kvadrátem jednotky náhodné veličiny!!! Tato nevýhoda rozptylu je důvodem zavedení směrodatné odchylky.

Směrodatná odchylka Směrodatná odchylka 𝝈 Jakou představu o náhodné veličině X si lze udělat na základě její stř. hodnoty 𝜇 a sm. odchylky 𝜎? Směrodatná odchylka neumožňuje srovnávat variabilitu náhodných veličin měřených v různých jednotkách! Proto zavádíme var. koeficient. 𝜎(𝑌)= 𝐷(𝑋) ∀𝑘>0:𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 (Čebyševova nerovnost) k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 >0 2 >0,75 3 >0,89

Variační koeficient Variační koeficient 𝜸 je definován pouze pro nezáporné náhodné veličiny. Variační koeficient – směrodatná odchylka v procentech střední hodnoty Čím nižší var. koeficient, tím homogennější soubor. 𝛾 > 50% značí silně rozptýlený soubor. 𝛾= 𝜎 𝜇 , resp. 𝜎 𝜇 ∙100 (%)

5 Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se, se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se) s pravděpodobnostmi uvedenými v níže uvedené tabulce. Vylučovatelství skupinově specifických substancí ABH Určete rozptyl, směrodatnou odchylku a variační koeficient počtu alel Se. Genotyp potomka Počet alel Se Pravděpodobnost Nevylučovatel (se, se) 0,25 Heterozygotní vylučovatel (Se, se) 1 0,50 Homozygotní vylučovatel (Se, Se) 2

Modelujeme výšku chlapců ve věku 3,5 – 4 roky. Vysvětlete: 6 Modelujeme výšku chlapců ve věku 3,5 – 4 roky. Vysvětlete: 2% kvantil modelované náhodné veličiny je 93 cm. Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. V jakém rozpětí lze očekávat výšku chlapců ve věku 3,5 – 4 roky? Pro interpretaci využijte Čebyševovu nerovnost. Střední hodnota modelované NV je 102 cm, směrodatná odchylka je 4,5 cm. Posuďte variabilitu modelované NV. (Není příliš vysoká? Pro posouzení použijte variační koeficient.) Víme, že pro distribuční funkci modelované NV platí: 𝐹 111 =0,98. Co jsme se dozvěděli?

Míry šikmosti a špičatosti

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé.

pozitivně zešikmené rozdělení Šikmost 𝛼 3 Míra symetrie rozdělení NV 𝛼 3 = 𝜇 3 ′ 𝜎 3 = 𝐸 𝑋−𝐸(𝑋) 3 𝜎 3 x f(x) x f(x) x f(x) 𝛼 3 <0 negativně zešikmené rozdělení 𝛼 3 =0 symetrické rozdělení 𝛼 3 >0 pozitivně zešikmené rozdělení 𝐸(𝑋)< 𝑥 0,5 < 𝑥 𝑥 = 𝑥 0,5 =𝐸(𝑋) 𝑥 < 𝑥 0,5 <𝐸(𝑋) obvykle

Špičatost 𝛼 4 𝛼 4 = 𝜇 4 ′ 𝜎 4 = 𝐸 𝑋−𝐸(𝑋) 4 𝜎 4 x f(x) x f(x) x f(x) míra koncentrace kolem průměru standardizovaná špičatost 𝛼 4 −3 𝛼 4 = 𝜇 4 ′ 𝜎 4 = 𝐸 𝑋−𝐸(𝑋) 4 𝜎 4   x f(x) x f(x) x f(x) 𝛼 4 <3 špičatost menší než u norm. rozdělení (plošší rozdělení) 𝛼 4 =3 špičatost odpovídající normálnímu rozdělení 𝛼 4 >3 špičatost větší než u norm. rozdělení (špičatější rozdělení)

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008 Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g1, angl. skewness) a špičatost (g2, angl. kurtosis).

Literatura Litschmannová, M. (2012), Vybrané kapitoly z pravděpodobnosti, elektronická skripta a doplňkové interaktivní materiály (kapitola Úvod do teorie pravděpodobnosti) Zvárová, J. (1999), Základy statistiky pro biomedicínské obory, dostupné on-line: http://new.euromise.org/czech/tajne/ucebnice/html/html/statist.html (kapitola 4) Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN 978- 80-7204-782-6 (kapitola 3)

Děkuji za pozornost!