Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Základy popisné statistiky aneb známe tři druhy lži: –úmyslná –neúmyslná –statistika.

Podobné prezentace


Prezentace na téma: "Základy popisné statistiky aneb známe tři druhy lži: –úmyslná –neúmyslná –statistika."— Transkript prezentace:

1 Základy popisné statistiky aneb známe tři druhy lži: –úmyslná –neúmyslná –statistika

2 popisná statistika cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! charakteristiky polohy a variability Statistika je jako bikini. Co odhaluje je zajímavé, co skrývá je podstatné. Aaron Levenstein

3 průměrná teplota: 9.2°C minimum: 4°C maximum: 15°C rozsah: 11°C modus: 9°C medián: 9°C rozptyl: 5.1°C směrodatná odchylka: 2.3°C denteplota 1.4.200811 2.4.200810 3.4.200810 4.4.20089 5.4.20088 6.4.20087 7.4.20088 8.4.20089 9.4.20084 10.4.20089 11.4.20088 12.4.20087 13.4.20088 14.4.20089 15.4.200812 16.4.200813 17.4.200815 18.4.200811 19.4.200812 20.4.200810 21.4.20089 22.4.20088 23.4.20089 24.4.200811 25.4.200810 26.4.20089 27.4.20086 28.4.20086 29.4.20087 30.4.200812 samotná data (11; 10; 10; 9; 8;……) = základní soubor N = počet prvků základního souboru = 30 (prvek = pozorování) X i = hodnota i-tého prvku (X 1 =11; X 16 =13;…)

4 histogram četností zajímá nás rozložení dané proměnné v celém souboru vývoj proměnné zajímá nás vývojový trend proměnné

5 Různé typy dat data na stupnici –nominální (kategoriální, klasifikační) dané třídy (kategorie) barva očí, typ podloží,…. –ordinální (pořadová) mohu seřadit známky ve škole, stupnice tvrdosti,… –intervalové dané intervaly mezi jednotkami nemají podíly (nemají jednoznačně danou nulu) teplota čas –cirkulární (pozor na průměry!) –podílové (poměrné) jednoznačně daná nula měření,….. Když má hlavu v sauně a nohy v ledničce, hovoří statistik o příjemné průměrné teplotě. Franz Josef Strauß

6 základní popisné statistiky průměr –aritmetický –geometrický –harmonický základní soubor: 4,5,6,8,12

7 vážený průměr zobecnění aritmetického zohledňuje důležitost některých pozorování potřebuji hodnoty (x 1, x 2, x 3,…) a jejich váhy (w 1, w 2, w 3,….) 30 samic má průměr hmotnosti 60 kg, 20 samců má průměr 80 kg. Celkový průměr není 70 kg, ale

8 normální rozdělení

9 základní popisné statistiky modus –nejčastěji se vyskytující hodnota –min. modus = 1, max. modus = N –může jich být víc –odpovídá vrcholu histogramu četností medián –polovina pozorování menší než medián, polovina větší –střed uspořádaného základního souboru –další kvantily – kvartily, percentily apod. (86% percentil říká, že 86% prvků leží pod touto hodnotou a 14% nad ní) –i pro pouze „seřazená“ data (na ordinální stupnici) – např. jídlo je vynikající (1), dobré (2), ucházející (3), bez chuti (4), nic moc (5), hnusné (6), vyvolávající zvracení (7) –Beaufortova stupnice síly větru, Mohsova stupnice tvrdosti apod. –v případě „ulítlé“ hodnoty lepší vypovídající hodnota než průměr

10 základní popisné statistiky pokud mám platy v podniku: 14 520; 11 350; 12 645; 14 520; 13 562; 14 520; 32 458; 38 452; 10 235; 11 548; „průměrný plat“ = 16 824 medián = 13 562

11 základní popisné statistiky rozptyl (variance) –průměrná hodnota druhé mocniny odchylky od průměru směrodatná odchylka –odmocnina z rozptylu –čím menší, tím nižší variabilita dat základní soubor: 4,5,6,8,12 průměr = 7

12 náhodný výběr většinou nemáme k dispozici celý základní soubor (všechny mihule, klešťanky, brambory, deváťáky apod.) provedeme tedy náhodný výběr, ten zkoumáme a na základě výběrového šetření se snažíme hypotetický základní soubor popsat charakteristiky tedy (sofistikovaně) odhadujeme!!! není snadné provést náhodný výběr

13 charakteristiky výběru počet prvků n průměr se počítá stejně rozptyl (variance) výběru jinak! směrodatná odchylka výběru variační koeficient – porovnává variabilitu nestejně velkých objektů (myš a slon) – bezrozměrné číslo

14 směrodatná odchylka výběru –empirické pravidlo: většina hodnot se neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru. normální rozdělení:

15 přesnost odhadu průměru výběrový průměr = náhodná veličina! (náhodné výběry z jednoho základního souboru se liší)  má také svůj rozptyl z rozptylu průměru lze spočítat směrodatnou odchylku průměru = střední chyba průměru nepopisuje variabilitu dat, ale přesnost odhadu

16 848 727 828 848 72 84 84 93 84 66 915 814 716 812 616 9 průměr7.75 sm. odchylka0.905.640.43 modus848 medián848 sm. odchylka výběru0.935.830.50 střední chyba průměru0.231.450.25 n16 4 náhodné výběry: vždy musím uvádět n, průměr, sm. odchylku ostatní podle potřeby

17 grafy vynikající prostředek pro zpřehlednění dat také pro klamání čtenáře

18 podle Biostatistika, Lepš, PřF

19

20

21 vždy je třeba vědět z jakého základu se počítají procenta!

22 jak na to v excelu? statistické funkce –PRŮMĚR, SMODCH, MODE, MEDIAN, VAR, ČETNOSTI,… (pozor – maticové vzorce – zaklínadlo Ctrl+Shift+Enter) –=SMODCH.VÝBĚR(F1:F16)/ODMOCNINA(POČET(F1: F16)) grafy – spojnicové, sloupcové, koláčové –podle typu dat, záměru

23 jak na to v excelu? pro pokročilé funkce musíme aktivovat doplněk „analýza dat“

24

25 histogram četnosti velmi užitečný, zobrazuje přibližné rozdělení sledované proměnné vizualizace frekvence dat

26

27 zdroje a materiály Lepš J.: Biostatistika http://botanika.bf.jcu.cz/suspa/vyuka/statistika.php Papáček M., Slipka J., 1997: Úvod do odborné práce (pro posluchače studia učitelství biologie). PF JČU, České Budějovice, 88 s.


Stáhnout ppt "Základy popisné statistiky aneb známe tři druhy lži: –úmyslná –neúmyslná –statistika."

Podobné prezentace


Reklamy Google