Proč statistika ? Dva důvody Popis Inference

Slides:



Advertisements
Podobné prezentace
Základní statistické pojmy
Advertisements

kvantitativních znaků
Testování parametrických hypotéz
Testování neparametrických hypotéz
Testování statistických hypotéz
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Statistika II Michal Jurajda.
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Tloušťková struktura porostu
Obsah statistiky Jana Zvárová
Testování hypotéz vymezení důležitých pojmů
Analýza dat.
MUDr. Michal Jurajda, PhD. ÚPF LF MU
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Řízení a supervize v sociálních a zdravotnických organizacích
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regrese.
Lineární regresní analýza
Test dobré shody Fisherův přesný test McNemar test
Biostatistika 4. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Teorie psychodiagnostiky a psychometrie
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
Popisná analýza v programu Statistica
1. cvičení
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Základy testování hypotéz
IV..
Základy popisné statistiky
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Základní informace o předmětu1. Přednášející: RNDr. Martin Hála, CSc. katedra matematiky, B105, Další informace a soubory ke stažení.
Možnosti biostatistiky RNDr. Karel Hrach, Ph.D. Ústav zdravotnických studií UJEP Biomedicínský výzkum s podporou evropských zdrojů v nemocnicích ( )
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
INDUKTIVNÍ STATISTIKA
Opakování – přehled metod
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Popisná analýza v programu Statistica
Induktivní statistika
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Normální rozdělení a ověření normality dat Modelová rozdělení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Neparametrické testy pro porovnání polohy
Koncepce normality/normálnosti v medicíně
Úvod do induktivní statistiky
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Statistika a výpočetní technika
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Náhodné výběry a jejich zpracování
Transkript prezentace:

Proč statistika ? Dva důvody Popis Inference Hledání způsobu redukce dat k zachycení důležitých charakteristik dat Inference Jak (a kdy) zobecnit z výběru na větší populaci

Stupně zvládnutí analýzy dat Základní: zvládnutí základů statistiky a statistických testů Střední: Zvládnutí lineárních modelů (ANOVA a regrese) Pokročilý: Rozšíření lineárních modelů Expertní znalost: vážný zájem o modelování a statistiku V každém stupni je nutné: Znalosti, Dovednosti, Zkušenosti

Popisná statistika

První dojem Druhý dojem 3.88 3.38 1.88 .63 2.00 3.13 3.88 4.25 2.50 .50 3.25 3.75 3.13 1.50 1.50 1.88 3.75 .88 2.00 2.25 2.38 1.13 3.25 3.38 2.88 1.00 .88 -.25 3.50 1.63 4.13 1.50 .38 2.00 4.63 2.13

První dojem Druhý dojem 3.88 3.38 1.88 .63 2.00 3.13 3.88 4.25 2.50 .50 3.25 3.75 3.13 1.50 1.50 1.88 3.75 .88 2.00 2.25 2.38 1.13 3.25 3.38 2.88 1.00 .88 -.25 3.50 1.63 4.13 1.50 .38 2.00 4.63 2.13

Popis rozložení dat frequency

Porovnání rozložení dat frequency Muži frequency Ženy Jak lze zobrazit diference?

Složitější lineární vztahy Uspokojení ze současného stavu

Popisná statistika Usiluje o grafickou a numerickou organizaci dat, jejich redukci a charakterizaci.

Typy studií Experimentální: Observační: Některé faktory a proměnné (nezávisle proměnné) jsou manipulovány výzkumníkem. Observační: Nezávisle proměnné a prediktory jsou výzkumníkem pouze pozorovány a zaznamenávány (bez manipulace).

Typy proměnných Prediktory a nezávisle proměnné: Závisle proměnná: Příčina nebo antecedentní podmínka, která se využívá k predikci výstupní (závislé, outcome) proměnné. Závisle proměnná: Proměnná, kterou považujeme za závisle proměnnou (často důsledek, outcome).

Typy proměnných Spojitá proměnná: Diskrétni (kategoriální) proměnná: Nekonečně moho hodnot (celý interval v R). Diskrétni (kategoriální) proměnná: Hodnoty označují kategorie (také četnosti) Ordinální Nominální Množina kategorií bez řazení Množina kategorií, které lze seřadit

Sumarizace diskrétních dat Jméno Barva očí Jana Hnědá Tomáš Modrá Dana Zelená Jan Josef Emil Anna Karla Kateřina Štěpán Eva Romeo

Frekvenční tabulka (tabulka četností) Barva očí Četnost Hnědá Modrá Zelená 33 14 3

Četnostní tabulka Relativní četnost Barva očí Četnost 33 66% Hnědá 14 28% 6% Hnědá Modrá Zelená

Sloupkový graf četností

Sloupkový graf relativních četností

Sumarizace spojitých dat Jméno Hodiny spánek / noc Jana 6 Tomáš 7.5 Dana 10.5 Jan 9 Josef 7 Emil Anna 8 Karla 5 Kateřina 8.5 Štěpán 6.5 Eva Romeo 4

Frekvenční tabulka Hodiny spánku Četnost 3 - 4 hod. 1 4 - 5 hod. 3 6 14 16 5 2

Histogram (četnosti)

Tabulka četností Hodiny spánku Relativní Četnosti 2% 6% 12% 28% 32% 10% 4% Četnosti 3 - 4 hod. 4 - 5 hod. 5 - 6 hod. 6 - 7 hod. 7 - 8 hod. 8 - 9 hod. 9 - 10 hod. 10 - 11 hod. 1 3 6 14 16 5 2

Histogram (relativní četnosti)

Tabulka četností Hodiny spánku Relativní četnosti Kumulativní četnosti 2% 8% 20% 48% 80% 90% 96% 100% Četnosti 3 - 4 hod. 4 - 5 hod. 5 - 6 hod. 6 - 7 hod. 7 - 8 hod. 8 - 9 hod. 9 - 10 hod. 10 - 11 hod. 1 3 6 14 16 5 2 2% 6% 12% 28% 32% 10% 4%

Graf lodyhy a listů Lodyha Listy 2 3 4 5 6 1 1 5 6 7 2 5 4 5 4 9 Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 Lodyha Listy 2 3 4 5 6 1 1 5 6 7 2 5 4 5 4 9

Graf lodyhy a listů Lodyha Listy 2 3 4 5 6 2 5 4 5 1 1 5 6 7 4 9 Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 Lodyha Listy 2 3 4 5 6 2 5 4 5 1 1 5 6 7 4 9

Dvojitý graf lodyhy a listů Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 2 3 4 5 6 2 5 7 ženy 1 1 5 6 9 muži

Vizuální prezentace rozložení dat - shrnutí Diskrétní data Četnostní tabulky Sloupkové grafy Spojitá data Četnostní tabulky Histogramy Graf lodyhy a listů

Inferenční statistika

Inferenční statistika Populace: Množina jedinců, která nás zajímá Výběr: Podmnožina jedinců vybraná z populace Inferenční statistika

Jsou rozdílnosti způsobené pouhou náhodou?

Důležité pojmy Parametr: Statistika: Výběrová chyba: Charakteristika populace. Označuje se řeckými písmeny jako  nebo . Statistika: Charakteristika výběru. Označuje se speciálními znaky jako třeba m ( ) nebo s. Výběrová chyba: Popisuje množství chyby, které může existovat u výběrové charakteristiky ve vztahu k populační charakteristice.

Chceme vědět, zda Petr je nad průměrem bodování v trestných hodech Chceme vědět, zda Petr je nad průměrem bodování v trestných hodech. Sbíráme data.

Sadíte 10,00 €, že další hod bude v koši? M K K M K M % košů = 0.75 % košů = 0.63 % košů = 0.58

Rozdíly ve výběrech nemusí být spolehlivé (zvláště, jestliže rozdíly jsou malé nebo jsou malé výběry) Inferenční statistika nám říká, zda výsledek způsobila pouze náhoda nebo ne.

Důležité vyjasnění Statistika se ptá: byl efekt způsoben jenom náhodnou? Náhodné vlivy: Náhodná fluktuace Nenáhodné příčiny: Skutečný rozdíl v populacích Systematická chyba v designu studie Inferenční statistika odděluje Statisticky významný výsledek, neznamená, že výsledek je potvrzením hypotézy. Pouze, že není náhodný.

Inferenční statistika Popisná statistika Teorie pravděpodobnosti

Typy analýzy NV -- kategoriální (skupiny); ZV --spojitá Jednovýběrový test t-test. Úsudek o průměru v jedné skupině. Dvouvýběrový t-test. Diference mezi průměry dvou skupin. ANOVA. Diference v průměrech více skupin.

Typy analýzy NP --spojitá; ZP --spojitá Korelace. Síla lineárního vztahu mezi dvěma spojitými proměnnými Regrese. Prokládání přímky nebo jiné křivky.

Typy analýzy NP -- kategoriální (skupiny); ZP -- kategoriální Z-test pro relativní četnosti. Diference mezi dvěma výběrovými četnostmi. Chi-kvadrát test. Rozložení relativních četností a porovnání skupin.

Chybovost každodenního usuzování Proč statistika? Chybovost každodenního usuzování

Každodenní statistické uvažování Něco z ničeho: chybné vnímání náhodných dat. 2. Mnoho z mála: chybné posouzení z malého množství dat. 3. Vidíme to, co očekáváme: systematické zkreslení z nejednoznačných dat.

Chybná interpretace náhodných dat “Lidský rozum předpokládá větší stupeň pořádku a shody ve věcech, než jaká je skutečnost; ačkoliv většina věci nemá řád, člověk nachází paralely, kontingence a podobnosti tak, kde žádné nejsou.” -Francis Bacon

Otázky ?