Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“

Podobné prezentace


Prezentace na téma: "„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“"— Transkript prezentace:

1 „VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
STATISTIKA „VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“ Teze přednášky prof. MVDr. Petra Dvořáka, CSc.

2 Exaktnost věd „míra platnosti určité zákonitosti, vztahu, popisu, pravidla“ matematika x biologie 1 + 1 = ~ (v 68 %) 2 „věda je omyl na úrovni své doby“

3 ETAPY STATISTICKÉHO ZKOUMÁNÍ
Statistické zjišťování (plán experimentu, rozsah souboru, přesnost, pravděpodobnost testování, shromažďování dat) Zpracování statistických údajů (výsledky, setřídění, tabulky, grafy) Vyhodnocení zpracovaných údajů a jejich analýza (diskuse a závěr, konečný výsledek - nejčastěji střední hodnota a míra její variability, analýza, 0 hypotézu potvrdíme, vyvrátíme, zdůvodníme, srovnáme s jinými autory)

4 Statistické zjišťování
ZÁKLADNÍ X VÝBĚROVÝ soubor N, X (µ), σ n, x, s Výběr NÁHODNÝ X ZÁVISLÝ pomocí PC, tabulek člověkem, neobjektivní

5 Zákon rozdělení náhodných veličin
Každé hodnotě, či množství hodnot z každého intervalu je přiřazena pravděpodobnost, že náhodná veličina nabude určitou hodnotu, resp. hodnotu v rámci určitého intervalu.

6 ROZDĚLENÍ ČETNOSTI četnost sledovaný znak - tuk [%]

7 ZNAKY SPOJITÉ X NESPOJITÉ (diskrétní) KVALITATIVNÍ X KVANTITATIVNÍ
ROZDĚLENÍ SOUBORU ZNAKŮ normální, exponenciální, studentizované atd.

8 Charakteristika souboru znaků
VARIABILITA (proměnlivost) ASYMETRIE (šikmost) EXCES (špičatost)

9 Normální rozložení a interval spolehlivosti
Čím plošší křivka, tím větší variabilita sledovaného znaku, tím více plochy pro odlehlé hodnoty s nižší pravděpodobností.

10 Chyby stanovení (měření)
HRUBÉ – testování odlehlých hodnot SOUSTAVNÉ – opravný faktor NÁHODNÉ – třídění statistických dat

11 Test odlehlých hodnot Q – test (Deanův –Dixonův test)
R= xmax-xmin Tabulka hodnot QT (Eckschlager et al. 1980) Qt n P = 95% P = 99% 3 0,914 0,988 4 0,765 0,889 5 0,642 0,760 6 0,560 0,698 7 0,507 0,637 8 0,468 0,590 9 0,437 0,555 10 0,412 0,527

12 Zpracování statistických údajů
Třídění statistických dat Statistické charakteristiky Tabulky – uvádějí přesné hodnoty Grafy – udávají průběh závislostí

13 Třídění statistických dat
1. Podle obměn dle diskrétního znaku 2. Intervalové rozdělení četností u velkého počtu znaků nebo značného rozsahu souboru - Počet intervalů 6 – 20 - Stejná šířka intervalů - Střed intervalu – celé číslo

14 Stupnice nepravdy STATISTIKA VELKÁ LEŽ LEŽ 2 1 3

15 Statistické charakteristiky
Střední hodnoty (míry polohy) 1. Aritmetický průměr X x (nikoliv Ø - technický průměr trubky) .

16 Střední hodnoty (míry polohy)
2. Medián hodnota znaku stojícího přesně uprostřed souboru, který byl uspořádán podle velikosti Necitlivý k extrémním hodnotám.

17 Střední hodnoty (míry polohy)
3. Modus má nejvyšší četnost L dolní hranice modálního intervalu, D1 rozdíl četností modálního intervalu a četností jemu předcházejícímu intervalu, D2 rozdíl četností modálního a následujícího intervalu, h šířka intervalu

18 Míry variability Variační rozpětí

19 Metoda nejmenších čtverců
∑ Δ = 0 rozptyl (variance) = + Δ + + + + ∑ Δ2 n

20 Míry variability směrodatná odchylka σ výběru s střední chyba výběru, SD standard deviation
n – 1 = ν počet stupňů volnosti výběrového souboru n > 50 ↔ ν se významem blíží N základního souboru

21 Míry variability relativní směrodatná odchylka sr
Variační koeficient Vx, vk [%] kontrola vzorců !!!

22 Míry variability Směrodatná odchylka průměru sx (střední chyba průměru) S.E.M. standard error of mean X = ( x ± sx ) jednotka

23 68,3 % pravděpodobnost X = | x ± sx | 95,4 % pravděpodobnost X = | x ± 2sx | 99,7 % pravděpodobnost X = | x ± 3sx |

24 Vícerozměrné statistické soubory
Závislosti, kde hodnotě nezávisle proměnné odpovídá jediná hodnota (nebo střední hodnota) závisle proměnné nazýváme funkční závislost dvourozměrného statistického souboru. Lineární, exponenciální, logaritmické, polynomické různého stupně

25 Metoda lineární regrese y = bx + a
Závisle proměnná + Δ + + + α + a Nezávisle proměnná x b = tg α a

26 Výpočet parametrů lineární regrese y = bx + a

27 Grafické metody Metoda těžišť Metoda obalových přímek

28 Korelace - těsnost závislosti
Koeficient korelace r | -1; 1| Koeficient determinace r [%] (kolik % bodů leží ideálně na přímce) Index korelace I |0; 1| u nelineárních závislostí

29 Korelace stupeň závislosti, těsnost
r < 0, nízká 0,3 – 0,5 mírná (9 – 25 %) 0,5 – 0,7 význačná (25 – 49 %) 0,7 – 0,9 velká (49 – 81 %) 0,9 – 0,99 velmi vysoká (81 – 99 %)

30 Testování hypotéz prokázat shodnost nebo rozdílnost několika souborů získaných dat úkolem je vypočítat hodnotu tzv. testovacího kriteria α , tuto hodnotu porovnat s hodnotou ”kritickou” (nalezneme v tabulkách pro určitou pravděpodobnost 95 nebo 99 %) definovanou pro hladinu významnosti testů α = 0,05 a α = 0,01

31 Testování hypotéz Procentuální interval shody
Testování kvantitativních znaků studentův t-test analýza variance ANOVA Testování kvalitativních znaků χ2 test test nezávislosti v kontingenčních tabulkách

32 Procentuální interval shody
Rychlá orientační metoda ve cvičeních Experimentální hodnotu vyjádříme jako procento hodnoty tabulkové (ta je 100 %) rozdíl ± 1 % (5 %) odpovídá α = 0,01 (0,05) Testování shody experimentálních souborů výsledků mezi sebou Sřední hodnota jednoho z nich se považuje za 100 %.

33 t - test test průkaznosti rozdílů dvou průměrů ze souborů na sobě nezávislých základní ku výběrovému µ : x dva výběrové vůči sobě 1) rozsahy shodné 2) rozsahy různé

34 t - test n homogenita rozptylů ! F test ν = nA + nB - 2
hladina významnosti (α) (ν) 6 7 8 9 10 11 12 14 16 20 50 0,05 2,45 2,36 2,31 2,26 2,23 2,20 2,18 2,14 2,12 2,09 2,01 0,01 3,71 3,50 3,36 3,25 3,17 3,11 3,06 2,98 2,92 2,84 2,68 homogenita rozptylů ! F test ν = nA + nB - 2

35 nehomogenita rozptylů
je třeba vypočítat počet stupňů volnosti ν

36 Párový t - test testování rozdílu dvou průměrů na sobě závislých znaků
- před pokusem po pokusu - dvojice hodnot na témže jedinci - hodnocení léčiva dvěma metodami

37 ANOVA - analýza variance jednofaktorová
rozdíl mezi průměry několika na sobě nezávislých souborů TESTOVACÍ KRITÉRIUM KRITICKÁ HODNOTA tabulky rozdělení F f1 k k = sloupce (skupiny) f2 n-k n = řádky (hodnoty) f1 počet stupňů volnosti čitatele f2 počet stupňů volnosti jmenovatele ANOVA dvoufaktorová bez interakce

38 testování nezávislosti kvalitativních znaků
χ2 test (2 znaky ve 2 souborech) test nezávislosti v kontingenčních tabulkách

39 obměny kvalitativního znaku
χ2 test obměny kvalitativního znaku suma obměny podle souborů a b a+b c d c+d a+c b+d n α = 0,05 χ2(1) = 3, α = 0,01 χ2(1) = 6,63

40 Tabulky a grafy název musí být natolik výstižný, aby čtenář nemusel číst text na osu x grafu – nezávisle proměnnou na osu y grafu – závisle proměnnou veličiny [ jednotky ] graf uvádí přehledně závislost a variabilitu tabulka uvádí přesné hodnoty zaokrouhlování !

41 Grafické metody Metoda těžišť, sudý počet bodů n = 6 – 10
Metoda vyhodnocování terčů Metoda obalových přímek n > 20


Stáhnout ppt "„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“"

Podobné prezentace


Reklamy Google