„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“

Slides:



Advertisements
Podobné prezentace
Sedm základních nástrojů řízení jakosti. Kontrolní tabulky Vývojové diagramy Histogramy Diagramy příčin a následků Paretovy diagramy Bodové diagramy Regulační.
Advertisements

Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Ekonomicko-matematické metody č. 11 Prof. RNDr. Jaroslav Ramík, CSc.
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
Význam diferenciálních rovnic převzato od Doc. Rapanta.
STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.
Statistika Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc.
Grafy Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Induktivní statistika
Analýza variance (ANOVA).
Testování hypotéz Testování hypotéz o rozdílu průměrů
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
Náhodná veličina je veličina, která při opakování náhodného pokusu mění své hodnoty v závislosti na náhodě Náhodné veličiny označujeme X, Y, Z, ... hodnoty.
Interpolace funkčních závislostí
7. Statistické testování
Dobývání znalostí z databází základy statistiky
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
STATISTICKÉ METODY V GEOGRAFII
Testování hypotéz Testování hypotéz o rozdílu průměrů
Statistické pojmy. Statistické pojmy Statistika - vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Pojem statistika slouží k.
„Svět se skládá z atomů“
Charakteristiky variability
Charakteristiky variability
Výběrové metody (Výběrová šetření)
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
Testování hypotéz o rozdílu průměrů: Analýza rozptylu
Popisná /deskriptivní/ statistika
Základy statistické indukce
Molekulová fyzika 3. prezentace.
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Test z Metodologie – náměty k přípravě
Spojité VELIČINY Vyšetřování normality dat
PSY252 Statistická analýza dat v psychologii II
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Jevy a náhodná veličina
STATISTIKA Exaktní věda Úkoly statistiky zjišťovat data
XII. Binomické rozložení
STATISTIKA PRO EKONOMY (kombinovaná forma)
Základní statistické pojmy
Úvod do praktické fyziky
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
TŘÍDĚNÍ DAT je základní způsob zpracování dat.
Lineární regrese.
Metody sociálních výzkumů
Cauchyho rozdělení spojité náhodné veličiny
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
Náhodný jev, náhodná proměnná
Centrální limitní věta
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Více náhodných veličin
… jak přesně počítat s nepřesnými čísly
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“ STATISTIKA „VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“ Teze přednášky prof. MVDr. Petra Dvořáka, CSc.

Exaktnost věd „míra platnosti určité zákonitosti, vztahu, popisu, pravidla“ matematika x biologie 1 + 1 = 2 1 + 1 ~ (v 68 %) 2 „věda je omyl na úrovni své doby“

ETAPY STATISTICKÉHO ZKOUMÁNÍ Statistické zjišťování (plán experimentu, rozsah souboru, přesnost, pravděpodobnost testování, shromažďování dat) Zpracování statistických údajů (výsledky, setřídění, tabulky, grafy) Vyhodnocení zpracovaných údajů a jejich analýza (diskuse a závěr, konečný výsledek - nejčastěji střední hodnota a míra její variability, analýza, 0 hypotézu potvrdíme, vyvrátíme, zdůvodníme, srovnáme s jinými autory)

Statistické zjišťování ZÁKLADNÍ X VÝBĚROVÝ soubor N, X (µ), σ n, x, s Výběr NÁHODNÝ X ZÁVISLÝ pomocí PC, tabulek člověkem, neobjektivní

Zákon rozdělení náhodných veličin Každé hodnotě, či množství hodnot z každého intervalu je přiřazena pravděpodobnost, že náhodná veličina nabude určitou hodnotu, resp. hodnotu v rámci určitého intervalu.

ROZDĚLENÍ ČETNOSTI četnost sledovaný znak - tuk [%]

ZNAKY SPOJITÉ X NESPOJITÉ (diskrétní) KVALITATIVNÍ X KVANTITATIVNÍ ROZDĚLENÍ SOUBORU ZNAKŮ normální, exponenciální, studentizované atd.

Charakteristika souboru znaků VARIABILITA (proměnlivost) ASYMETRIE (šikmost) EXCES (špičatost)

Normální rozložení a interval spolehlivosti Čím plošší křivka, tím větší variabilita sledovaného znaku, tím více plochy pro odlehlé hodnoty s nižší pravděpodobností.

Chyby stanovení (měření) HRUBÉ – testování odlehlých hodnot SOUSTAVNÉ – opravný faktor NÁHODNÉ – třídění statistických dat

Test odlehlých hodnot Q – test (Deanův –Dixonův test) R= xmax-xmin Tabulka hodnot QT (Eckschlager et al. 1980)   Qt n P = 95% P = 99% 3 0,914 0,988 4 0,765 0,889 5 0,642 0,760 6 0,560 0,698 7 0,507 0,637 8 0,468 0,590 9 0,437 0,555 10 0,412 0,527

Zpracování statistických údajů Třídění statistických dat Statistické charakteristiky Tabulky – uvádějí přesné hodnoty Grafy – udávají průběh závislostí

Třídění statistických dat 1. Podle obměn dle diskrétního znaku 2. Intervalové rozdělení četností u velkého počtu znaků nebo značného rozsahu souboru - Počet intervalů 6 – 20 - Stejná šířka intervalů - Střed intervalu – celé číslo

Stupnice nepravdy STATISTIKA VELKÁ LEŽ LEŽ 2 1 3

Statistické charakteristiky Střední hodnoty (míry polohy) 1. Aritmetický průměr X x (nikoliv Ø - technický průměr trubky) .

Střední hodnoty (míry polohy) 2. Medián hodnota znaku stojícího přesně uprostřed souboru, který byl uspořádán podle velikosti Necitlivý k extrémním hodnotám.

Střední hodnoty (míry polohy) 3. Modus má nejvyšší četnost L dolní hranice modálního intervalu, D1 rozdíl četností modálního intervalu a četností jemu předcházejícímu intervalu, D2 rozdíl četností modálního a následujícího intervalu, h šířka intervalu

Míry variability Variační rozpětí

Metoda nejmenších čtverců ∑ Δ = 0 rozptyl (variance) = ------ + Δ + + + + ∑ Δ2 n

Míry variability směrodatná odchylka σ výběru s střední chyba výběru, SD standard deviation n – 1 = ν počet stupňů volnosti výběrového souboru n > 50 ↔ ν se významem blíží N základního souboru

Míry variability relativní směrodatná odchylka sr Variační koeficient Vx, vk [%] kontrola vzorců !!!

Míry variability Směrodatná odchylka průměru sx (střední chyba průměru) S.E.M. standard error of mean X = ( x ± sx ) jednotka

68,3 % pravděpodobnost X = | x ± sx | 95,4 % pravděpodobnost X = | x ± 2sx | 99,7 % pravděpodobnost X = | x ± 3sx |

Vícerozměrné statistické soubory Závislosti, kde hodnotě nezávisle proměnné odpovídá jediná hodnota (nebo střední hodnota) závisle proměnné nazýváme funkční závislost dvourozměrného statistického souboru. Lineární, exponenciální, logaritmické, polynomické různého stupně

Metoda lineární regrese y = bx + a Závisle proměnná + Δ + + + α + a Nezávisle proměnná x b = tg α a

Výpočet parametrů lineární regrese y = bx + a

Grafické metody Metoda těžišť Metoda obalových přímek

Korelace - těsnost závislosti Koeficient korelace r | -1; 1| Koeficient determinace r2 . 100 [%] (kolik % bodů leží ideálně na přímce) Index korelace I |0; 1| u nelineárních závislostí

Korelace stupeň závislosti, těsnost r < 0,3 nízká 0,3 – 0,5 mírná (9 – 25 %) 0,5 – 0,7 význačná (25 – 49 %) 0,7 – 0,9 velká (49 – 81 %) 0,9 – 0,99 velmi vysoká (81 – 99 %)

Testování hypotéz prokázat shodnost nebo rozdílnost několika souborů získaných dat úkolem je vypočítat hodnotu tzv. testovacího kriteria α , tuto hodnotu porovnat s hodnotou ”kritickou” (nalezneme v tabulkách pro určitou pravděpodobnost 95 nebo 99 %) definovanou pro hladinu významnosti testů α = 0,05 a α = 0,01

Testování hypotéz Procentuální interval shody Testování kvantitativních znaků studentův t-test analýza variance ANOVA Testování kvalitativních znaků χ2 test test nezávislosti v kontingenčních tabulkách

Procentuální interval shody Rychlá orientační metoda ve cvičeních Experimentální hodnotu vyjádříme jako procento hodnoty tabulkové (ta je 100 %) rozdíl ± 1 % (5 %) odpovídá α = 0,01 (0,05) Testování shody experimentálních souborů výsledků mezi sebou Sřední hodnota jednoho z nich se považuje za 100 %.

t - test test průkaznosti rozdílů dvou průměrů ze souborů na sobě nezávislých základní ku výběrovému µ : x dva výběrové vůči sobě 1) rozsahy shodné 2) rozsahy různé

t - test n homogenita rozptylů ! F test ν = nA + nB - 2 hladina významnosti (α) (ν) 6 7 8 9 10 11 12 14 16 20 50 0,05 2,45 2,36 2,31 2,26 2,23 2,20 2,18 2,14 2,12 2,09 2,01 0,01 3,71 3,50 3,36 3,25 3,17 3,11 3,06 2,98 2,92 2,84 2,68 homogenita rozptylů ! F test ν = nA + nB - 2

nehomogenita rozptylů je třeba vypočítat počet stupňů volnosti ν

Párový t - test testování rozdílu dvou průměrů na sobě závislých znaků - před pokusem po pokusu - dvojice hodnot na témže jedinci - hodnocení léčiva dvěma metodami

ANOVA - analýza variance jednofaktorová rozdíl mezi průměry několika na sobě nezávislých souborů TESTOVACÍ KRITÉRIUM KRITICKÁ HODNOTA tabulky rozdělení F f1 k-1 k = sloupce (skupiny) f2 n-k n = řádky (hodnoty) f1 počet stupňů volnosti čitatele f2 počet stupňů volnosti jmenovatele ANOVA dvoufaktorová bez interakce

testování nezávislosti kvalitativních znaků χ2 test (2 znaky ve 2 souborech) test nezávislosti v kontingenčních tabulkách

obměny kvalitativního znaku χ2 test obměny kvalitativního znaku suma obměny podle souborů a b a+b c d c+d a+c b+d n α = 0,05 χ2(1) = 3,84 α = 0,01 χ2(1) = 6,63

Tabulky a grafy název musí být natolik výstižný, aby čtenář nemusel číst text na osu x grafu – nezávisle proměnnou na osu y grafu – závisle proměnnou veličiny [ jednotky ] graf uvádí přehledně závislost a variabilitu tabulka uvádí přesné hodnoty zaokrouhlování !

Grafické metody Metoda těžišť, sudý počet bodů n = 6 – 10 Metoda vyhodnocování terčů Metoda obalových přímek n > 20