Základy popisné statistiky

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Statistika.
Statistické funkce v tabulkovém kalkulátoru Excel MS
Histogram představuje grafické zobrazení intervalového zobrazení četnosti znaku jakosti slouží k názornému zobrazení „struktury“ naměřených dat hranice.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Charakteristiky úrovně
UKAZATELE ZPŮSOBILOSTI A VÝKONNOSTI
Kvantitativní metody výzkumu v praxi
Statistické charakteristiky variability
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
AutorMgr. Lenka Závrská Anotace Očekávaný přínos Tematická oblastOperace s reálnými čísly Téma PředmětMatematika RočníkPrvní Obor vzděláváníUčební obory.
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
4EK416 Ekonometrie Úvod do předmětu – obecné informace
EXPLORATORNÍ STATISTIKA
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
Charakteristiky variability
Získávání informací Získání informací o reálném systému
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
KVANTILY OA a VOŠ Příbram.
Popisná statistika - pokračování
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
Základní statistické pojmy a postupy
Tloušťková struktura porostu
„EU peníze středním školám“

Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
Statistická chyba a hladina statistické významnosti
Obsah statistiky Jana Zvárová
Statistika 8. ročník Autorem materiálu je Mgr. Jana Čulíková
také Gaussovo rozdělení (normal or Gaussian distribution)
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Principy konstrukce norem a základní statistické pojmy
Odhady odhady bodové a intervalové odhady
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Přednost početních operací
Základní statistické charakteristiky
Statistika Ukazatelé variability
Jevy a náhodná veličina
Charakteristiky variability
Biostatistika 4. přednáška
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Biostatistika 8. přednáška
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
© Tom Vespa STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná analýza v programu Statistica
Základy popisné statistiky
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Statistika 2.cvičení
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná statistika: přehled
Popisná analýza v programu Statistica
Spojitá a kategoriální data Základní popisné statistiky
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Kapitola 3: Centrální tendence a variabilita
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Základy popisné statistiky aneb známe tři druhy lži: úmyslná neúmyslná statistika

popisná statistika cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! charakteristiky polohy a variability Statistika je jako bikini. Co odhaluje je zajímavé, co skrývá je podstatné. Aaron Levenstein

směrodatná odchylka: 2.3°C den teplota 1.4.2008 11 2.4.2008 10 3.4.2008 4.4.2008 9 5.4.2008 8 6.4.2008 7 7.4.2008 8.4.2008 9.4.2008 4 10.4.2008 11.4.2008 12.4.2008 13.4.2008 14.4.2008 15.4.2008 12 16.4.2008 13 17.4.2008 15 18.4.2008 19.4.2008 20.4.2008 21.4.2008 22.4.2008 23.4.2008 24.4.2008 25.4.2008 26.4.2008 27.4.2008 6 28.4.2008 29.4.2008 30.4.2008 průměrná teplota: 9.2°C minimum: 4°C maximum: 15°C rozsah: 11°C modus: 9°C medián: 9°C rozptyl: 5.1°C směrodatná odchylka: 2.3°C samotná data (11; 10; 10; 9; 8;……) = základní soubor N = počet prvků základního souboru = 30 (prvek = pozorování) Xi = hodnota i-tého prvku (X1=11; X16=13;…)

histogram četností zajímá nás rozložení dané proměnné v celém souboru vývoj proměnné zajímá nás vývojový trend proměnné

Různé typy dat data na stupnici nominální (kategoriální, klasifikační) dané třídy (kategorie) barva očí, typ podloží,…. ordinální (pořadová) mohu seřadit známky ve škole, stupnice tvrdosti,… intervalové dané intervaly mezi jednotkami nemají podíly (nemají jednoznačně danou nulu) teplota čas cirkulární (pozor na průměry!) podílové (poměrné) jednoznačně daná nula měření,….. Když má hlavu v sauně a nohy v ledničce, hovoří statistik o příjemné průměrné teplotě. Franz Josef Strauß

základní popisné statistiky základní soubor: 4,5,6,8,12 průměr aritmetický geometrický harmonický

vážený průměr zobecnění aritmetického zohledňuje důležitost některých pozorování potřebuji hodnoty (x1, x2, x3,…) a jejich váhy (w1, w2, w3,….) 30 samic má průměr hmotnosti 60 kg, 20 samců má průměr 80 kg. Celkový průměr není 70 kg, ale

normální rozdělení

základní popisné statistiky modus nejčastěji se vyskytující hodnota min. modus = 1, max. modus = N může jich být víc odpovídá vrcholu histogramu četností medián polovina pozorování menší než medián, polovina větší střed uspořádaného základního souboru další kvantily – kvartily, percentily apod. (86% percentil říká, že 86% prvků leží pod touto hodnotou a 14% nad ní) i pro pouze „seřazená“ data (na ordinální stupnici) – např. jídlo je vynikající (1), dobré (2), ucházející (3), bez chuti (4), nic moc (5), hnusné (6), vyvolávající zvracení (7) Beaufortova stupnice síly větru, Mohsova stupnice tvrdosti apod. v případě „ulítlé“ hodnoty lepší vypovídající hodnota než průměr

základní popisné statistiky pokud mám platy v podniku: 14 520; 11 350; 12 645; 14 520; 13 562; 14 520; 32 458; 38 452; 10 235; 11 548; „průměrný plat“ = 16 824 medián = 13 562

základní popisné statistiky základní soubor: 4,5,6,8,12 průměr = 7 rozptyl (variance) průměrná hodnota druhé mocniny odchylky od průměru směrodatná odchylka odmocnina z rozptylu čím menší, tím nižší variabilita dat

náhodný výběr většinou nemáme k dispozici celý základní soubor (všechny mihule, klešťanky, brambory, deváťáky apod.) provedeme tedy náhodný výběr, ten zkoumáme a na základě výběrového šetření se snažíme hypotetický základní soubor popsat charakteristiky tedy (sofistikovaně) odhadujeme!!! není snadné provést náhodný výběr

charakteristiky výběru počet prvků n průměr se počítá stejně rozptyl (variance) výběru jinak! směrodatná odchylka výběru variační koeficient – porovnává variabilitu nestejně velkých objektů (myš a slon) – bezrozměrné číslo

směrodatná odchylka výběru empirické pravidlo: většina hodnot se neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru. normální rozdělení:

přesnost odhadu průměru výběrový průměr = náhodná veličina! (náhodné výběry z jednoho základního souboru se liší)  má také svůj rozptyl z rozptylu průměru lze spočítat směrodatnou odchylku průměru = střední chyba průměru nepopisuje variabilitu dat, ale přesnost odhadu

vždy musím uvádět n, průměr, sm. odchylku   8 4 7 2 9 3 6 15 14 16 12 průměr 7.75 sm. odchylka 0.90 5.64 0.43 modus medián sm. odchylka výběru 0.93 5.83 0.50 střední chyba průměru 0.23 1.45 0.25 n náhodné výběry: vždy musím uvádět n, průměr, sm. odchylku ostatní podle potřeby

grafy vynikající prostředek pro zpřehlednění dat také pro klamání čtenáře

podle Biostatistika, Lepš, PřF

podle Biostatistika, Lepš, PřF

podle Biostatistika, Lepš, PřF

vždy je třeba vědět z jakého základu se počítají procenta!

jak na to v excelu? statistické funkce PRŮMĚR, SMODCH, MODE, MEDIAN, VAR, ČETNOSTI,… (pozor – maticové vzorce – zaklínadlo Ctrl+Shift+Enter) =SMODCH.VÝBĚR(F1:F16)/ODMOCNINA(POČET(F1:F16)) grafy – spojnicové, sloupcové, koláčové podle typu dat, záměru

jak na to v excelu? pro pokročilé funkce musíme aktivovat doplněk „analýza dat“

histogram četnosti velmi užitečný, zobrazuje přibližné rozdělení sledované proměnné vizualizace frekvence dat

zdroje a materiály Lepš J.: Biostatistika http://botanika.bf.jcu.cz/suspa/vyuka/statistika.php Papáček M., Slipka J., 1997: Úvod do odborné práce (pro posluchače studia učitelství biologie). PF JČU, České Budějovice, 88 s.