Základy statistiky.

Slides:



Advertisements
Podobné prezentace
Základní statistická analýza dat z pre- a klinických studií
Advertisements

Statistika.
Statistická indukce Teorie odhadu.
Testování parametrických hypotéz
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Statistika II Michal Jurajda.
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Popisná statistika - pokračování
Základní statistické pojmy a postupy
Testování hypotéz přednáška.
Obsah statistiky Jana Zvárová
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Charakteristiky variability
Statistika 2 Aritmetický průměr, Modus, Medián
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Biostatistika 4. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Biostatistika 1. přednáška Aneta Hybšová
RNDr. Monika Pávková Goldbergová
Popisná analýza v programu Statistica
1. cvičení
Základy testování hypotéz
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednovýběrový t-test Jednovýběrový test rozptylu V.d1 Statistické.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Statistika 1 Ústav lékařské informatiky, 2. LF UK 2008.
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Odhady parametrů základního souboru
Popisná analýza v programu Statistica
Normální rozdělení a ověření normality dat Modelová rozdělení
Bi8600: Vícerozměrné metody – cvičení
Proč statistika ? Dva důvody Popis Inference
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Deskriptivní statistika
Neparametrické testy pro porovnání polohy
Koncepce normality/normálnosti v medicíně
Úvod do induktivní statistiky
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
7. Kontingenční tabulky a χ2 test
Základy popisné statistiky
Náhodné výběry a jejich zpracování
Transkript prezentace:

Základy statistiky

Statistika popisná vyčerpávající šetření analytická, induktivní výběr základní charakteristika získaných dat vyčerpávající šetření analytická, induktivní charakterizace určitého vzorku populace, ze které usuzujeme na vlastnosti celého základního souboru výběr

Základní idea testování Rozlišení, co je na výsledku pozorování náhodné a co zákonité ↑ pravděpodobnost náhodného vzniku → výsledek pokládáme za náhodný ↓pravděpodobnost náhodného vzniku → výsledek pokládáme za zákonitý Hladina statistické významnosti 5%, hladina vysoké stat. významnosti 1%

Variabilita Opakovaných měření (chyba vážení, měření, přístroje atd.) Znaku v populaci (rozptyl znaku, přirozená variabilita – interindividuální) Měřené veličiny v čase (časová proměnlivost – intraindividuální) Biologických společenstev - mezipopulační rozdíly, rasové rozdíly = BIODIVERZITA

Variabilita - příčiny

Vybrané základní pojmy Experimentální jednotka – objekt, na kterém se provádí šetření Populace – soubor experimentálních jednotek Znak – vlastnost sledovaná na objektu Sledovaná veličina – číselná hodnota vyjadřující výsledek náhodného experimentu

ZÁKLADNÍ SOUBOR  NÁHODNÝ VÝBĚR  VÝBĚROVÝ SOUBOR ZNAK se stává náhodnou veličinou, pokud se jeho hodnota zjišťuje vylosováním objektu ze základního souboru: ZÁKLADNÍ SOUBOR  NÁHODNÝ VÝBĚR  VÝBĚROVÝ SOUBOR

Sběr dat data kvalitativní kvantitativní kategoriální, nominální (např. pohlaví)  potřeba kódování kvantitativní diskrétní kontinuální / spojitá ordinální (např. známky ve škole 1,2,3,4,5)

Sběr dat Databáze záznam: nositel znaku pole: znaky/proměnné

Sběr dat Vztah základní soubor x výběr každý prvek základního souboru musí mít stejnou pravděpodobnost, že se stane prvkem výběru!!!! Definice výběrových kritérií / kritérií exkluze Opakovatelnost výběru

Zobrazení dat tabulka, četnostní tabulka, histogram četností) originální setříděná histogram data data 115 <100: 0 135 100-110: 1 120 111-120: 0 140 121-130: 2 125 131-140: 4 130 141-150: 8 150 151-160: 4 145 161-170: 11 . >171: 0 .

Zobrazení dat histogram box and whisker plot sloupcový graf koláčový graf

Popis dat Distribuce normální Poissonova binomická Testy normality

Normální rozložení

Popis dat Míry polohy průměr () – součet hodnot děleno počtem medián (= 50 percentil, frekvenční střed) – polovina hodnot je menší a polovina větší modus - nejčastější hodnota

Popis dat Míry variability min-max (=rozsah, range) kvantily (horní 25%, dolní 75%) směrodatná odchylka (SD, ) rozptyl (2)

-3 -2 -1  +1 +2 +3 =medián =modus

-3 -2 -1  +1 +2 +3 =medián =modus 68% 95,5% 99,7%

symetrické průměr =medián =modus asymetrická modus průměr

Transformace dat

Statistická indukce základní soubor (populace) výběr soubor prvků, o kterém chceme statistickými metodami něco zjistit výběr reprezentativní část dané populace (zákl. souboru), která má sloužit k odvození závěrů platných pro celou populaci

Odhady parametrů rozložení Výběrové charakteristiky průměr , směrodatná odchylka s Vztahujeme na základní soubor průměr μ, směrodatná odchylka σ

alternativní hypotéza Testování hypotéz porovnání výběrového souboru a teorie o základním souboru porovnání dvou základních souborů na základě porovnání dvou výběrů nulová hypotéza alternativní hypotéza

Postup při testování hypotéz vyslovení hypotéz volba testu volba pravděpodobnosti chyby zamítnutí, hladiny významnosti α výpočet zamítnutí/nezamítnutí nulové hypotézy

Statistické testy • t-test závislý • t-test nezávislý nepárové párové • t-test nezávislý (klasický t-test, two-sample) • Mann-Whitney (=Wilcoxon nezávislý) • mediánový test • t-test závislý (one-sample) • Wilcoxon závislý • znaménkový test srovnání parametru mezi 2 skupinami objektů u stejných objektů v časové souslednosti testy parametrické (pro normální nebo téměř normální rozložení) neparametrické (pro jiné než normální rozložení)

Mnohonásobné srovnání Holmův postup: seřadíme pravděpodobnosti dle velikosti nejmenší násobíme počtem srovnání další počtem srovnání -1, další -2 atd. výsledky jsou nevýznamné od prvního vyššího než je zvolená úroveň (5%, 1%)