Normální rozdělení a ověření normality dat

Slides:



Advertisements
Podobné prezentace
Testování parametrických hypotéz
Advertisements

Jednovýběrové testy parametrickch hypotéz
Testování neparametrických hypotéz
Matematické metody vyhodnocování experimentů
Statistické metody v ochraně kulturního dědictví
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Pravděpodobnost a statistika opakování základních pojmů
Tloušťková struktura porostu
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
také Gaussovo rozdělení (normal or Gaussian distribution)
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
Vybraná rozdělení spojité náhodné veličiny
Základy ekonometrie Cvičení října 2010.
Statistická analýza únavových zkoušek
Hlavní charakteristiky křivky normálního rozdělení
Normální (Gaussovo) rozdělení
Vybraná rozdělení spojité náhodné veličiny
Lineární regrese.
Lineární regresní analýza
Další spojitá rozdělení pravděpodobnosti
Základy statistické indukce Základní soubor, náhodný výběr Základní statistický soubor (stručněji základní soubor) je statistický soubor, z něhož pořizujeme.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Statistické výpočty v MATLABu
Popisná statistika III
Odhad metodou maximální věrohodnost
AKD VII.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Základy ekonometrie 4EK211
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Generování náhodných čísel
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
(Popis náhodné veličiny)
Popisná analýza v programu Statistica
1. cvičení
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Inferenční statistika - úvod
IV..
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Odhady odhady bodové a intervalové odhady
Statistické testování – základní pojmy
Induktivní statistika - úvod
Základy statistické indukce
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Biostatistika Základní popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky
Popisná analýza v programu Statistica
STATISTICKÉ CHARAKTERISTIKY
Induktivní statistika
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Normální rozdělení a ověření normality dat Modelová rozdělení
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
Statistika a výpočetní technika
Rozdělení pravděpodobnosti
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Náhodné výběry a jejich zpracování
Transkript prezentace:

Normální rozdělení a ověření normality dat Normalita Normální rozdělení a ověření normality dat

Opakování Jaké znáte typy dat? Uveďte příklady… Jak popisujeme data?

Normální rozdělení I Nejklasičtějším modelovým rozložením, od něhož je odvozena celá řada statistických analýz je tzv. normální rozložení, známé též jako Gaussova křivka. Popisuje rozdělení pravděpodobnosti spojité náhodné veličiny: např. výška v populaci, chyba měření… Je kompletně popsáno dvěma parametry: μ – střední hodnota σ2 – rozptyl Označení: N(μ, σ2) Normalita je klíčovým předpokladem řady statistických metod Pro ověření normality existuje řada testů a grafických metod

Normální rozdělení II V rozmezí μ ± 3σ by se mělo vyskytovat 99,7 % všech hodnot Použití: zhodnotíme tvar rozdělení a přítomnost odlehlých hodnot 99,7 % všech hodnot

Standardizované normální rozdělení Normální rozdělení se střední hodnotou nula a jednotkovým rozptylem j(x) N (m,s) m x N (0,1) j(z) z z = x - m s Tabelovaná podoba Vzorec pro hustotu normálního rozdělení Vzorec pro hustotu standardizovaného normálního rozdělení

Vizuální ověření normality Pro hodnocení tvaru rozložení lze využít histogram (nevýhoda: nutné určit „vhodný“ počet sloupců) Vhodnější jsou: Q-Q graf (kvantil-kvantilový graf) P-P graf (pravděpodobnostně-pravděpodobnostní graf) N-P graf (normální-pravděpodobnostní graf) Opakování: Co je kvantil?

Řešení v softwaru Statistica I 1 V menu Graphs zvolíme 2D Graphs 2 2 Výběr rozdělení V případě, že máme v datech několik stejných hodnot, je vhodné odškrtnout Neurčovat průměrnou pozici svázaných pozorování 3

Rozdíl mezi N-P, Q-Q, P-P grafem ??? Pouze výměna os Znázorněn pozorovaný a teoretický kvantil PAMATUJ: Pocházejí-li data z normálního rozložení, pak body budou ležet okolo přímky Vykresleno kumulativní rozdělení

Vizualizace I. Zešikmená (nesymetrická) data Špičatost

Vizualizace II. Odlehlé hodnoty Diskrétní rozdělení