Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  %

Podobné prezentace


Prezentace na téma: "11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  %"— Transkript prezentace:

1 11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  % nejmenších hodnot, ze zbytku se spočítá průměr je robustní vůči odlehlým hodnotám volí se  = 0,1 (0,15) věk matek:

2 11. října 2004Statistika (D360P03Z) 2. předn.2 příklad – rodičky vyloučí se (celá část) nejmenších a 9 největších hodnot 18 19 20 20 20 21 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25 25 25 26 26 26 26 26 26 26 26 26 26 27 27 27 27 27 27 28 28 28 28 28 28 28 28 28 29 29 29 29 30 30 30 31 31 32 32 32 33 33 33 34 35 35 37 38

3 11. října 2004Statistika (D360P03Z) 2. předn.3 histogram, h = 3 (k=7) Věk matek věk četnost 20253035 0 5 10 15 20 25 30

4 11. října 2004Statistika (D360P03Z) 2. předn.4 vlastnosti charakteristik polohy změníme-li všechny hodnoty x i tak, že přidáme ke každé stejnou konstantu a, změní se o tutéž konstantu také charakteristika polohy (posunutí) změníme-li všechny hodnoty x i tak, že je vynásobíme kladnou konstantou b, toutéž konstantou musíme vynásobit původní charakteristiku polohy, abychom dostali charakteristiku polohy pro upravená data (změna měřítka) obecně

5 11. října 2004Statistika (D360P03Z) 2. předn.5 charakt. polohy v geo/demo (1) často známe jen průměry v dílčích souborech a četnosti: průměry se použijí jako x j *, četnosti standardně př.: věk nových profesorů/docentů UK 2002: 41 profesorů, průměrný věk 51,1 77 docentů, průměrný věk 47,8 celkový průměr: nikoliv

6 11. října 2004Statistika (D360P03Z) 2. předn.6 charakt. polohy v geo/demo (2) geografický střed - průsečík průměrné zeměpisné šířky a průměrné zeměpisné délky, průměry vážené velikostí sledovaného jevu geografický medián – obdoba mediánu, rozděluje geografické objekty do dvou disjunktních skupin hodnocená vlastnost určí váhy objektů uspořádání hodnocených znaků dáno zvolenou geografickou vlastností (např. zeměpisnou délkou)

7 11. října 2004Statistika (D360P03Z) 2. předn.7 charakteristiky variability (1) obecně přičtením stejné konstanty a (posunutím) se charakteristika variability nezmění vynásobení kladnou konstantou znamená, že stejnou konstantou nutno vynásobit charakteristiku variability měří nestejnost hodnot spojité veličiny rozpětí (jen pro výběr) kvartilové rozpětí

8 11. října 2004Statistika (D360P03Z) 2. předn.8 charakteristiky variability (2) (výběrový) rozptyl (nevyhovuje obecnému požadavku přesně) populační rozptyl  2 má ve jmenovateli n

9 11. října 2004Statistika (D360P03Z) 2. předn.9 charakteristiky variability (3) rozptyl měří průměrný čtverec vzdálenosti od průměru směrodatná odchylka: odmocnina z rozptylu vyhovuje obecnému požadavku výhoda směrodatné odchylky – stejný fyzikální rozměr jako původní data pro výběrový rozptyl z třídních četností Sheppardova korekce: odečti

10 11. října 2004Statistika (D360P03Z) 2. předn.10 příklad – věk matek rozpětí: R = 38 – 18 = 20 kvartilové rozpětí: R Q = 28 – 23 = 5 rozptyl směrodatná odchylka je 4,1

11 11. října 2004Statistika (D360P03Z) 2. předn.11 příklad – věk matek pomocí třídních četností: navíc Sheppardova korekce

12 11. října 2004Statistika (D360P03Z) 2. předn.12 charakteristiky variability (4) střední odchylka: průměr odchylek (od mediánu, někdy od průměru) střední diference: průměr vzájemných vzdáleností všech dvojic (je jich n 2 )

13 11. října 2004Statistika (D360P03Z) 2. předn.13 statistické charakteristiky v Excelu MS Excelnaše přednáška Stř. hodnota(výběrový) průměr Chyba stř. hodnoty(střední) chyba průměru Rozptyl výběruvýběrový rozptyl Rozdíl max-minrozpětí Hladina spolehlivosti poloviční délka intervalu spolehlivosti

14 11. října 2004Statistika (D360P03Z) 2. předn.14 normované char. rozptýlenosti dosud zavedené míry závisejí na volbě měřítka (např. délka v m nebo v km) hledáme charakteristiky nezávislé na měřítku nutně poměrové měřítko, kladné hodnoty variační koeficient (Giniho) koeficient koncentrace např. měří nerovnoměrnost příjmů, velikostí územních jednotek, souvisí s plochou u Lorenzovy křivky

15 11. října 2004Statistika (D360P03Z) 2. předn.15 Lorenzova křivka (věk matek)

16 11. října 2004Statistika (D360P03Z) 2. předn.16 Lorenzova křivka (obyvatelé – kraje) 0.00.20.40.60.81.0 0.0 0.2 0.4 0.6 0.8 1.0 Lorenz curve for population (Gini=0.224)

17 11. října 2004Statistika (D360P03Z) 2. předn.17 Lorenzova křivka variační řada, kladné kumulativní součty pro j = 0, 1, …, n úsečkami spojit body (j = 0, 1, …, n) zajímá nás plocha nad touto lomenou křivkou a pod úhlopříčkou jednotkového čtverce Giniho koeficient koncentrace je dvojnásobkem této plochy lze vzít v úvahu i váhy (četnosti)

18 11. října 2004Statistika (D360P03Z) 2. předn.18 příklad: obyvatelé jx (j) tjtj j /ntj /ntj /n 0-00,000 1304 220 0,0710,030 2427 321731 5410,1430,072 3506 5341 238 0750,2140,121 4517 3601 755 7050,2860,172 5548 4372 304 1420,3570,226 6549 3742 853 5160,4290,280... 141 262 66010 203 2691,000

19 11. října 2004Statistika (D360P03Z) 2. předn.19 příklad: obyvatelé

20 11. října 2004Statistika (D360P03Z) 2. předn.20 z-skór, standardizace variační koeficient, Giniho koeficient příkladem bezrozměrných veličin z-skór dostaneme nulový průměr, jednotkový rozptyl bezrozměrný umožní srovnávat různě obtížné testy, …

21 11. října 2004Statistika (D360P03Z) 2. předn.21 šikmost, špičatost šikmost – průměr z 3. mocnin z-skórů špičatost – průměr ze 4. mocnin z-skórů (někdy se ještě odečítá 3) někdy se počítají odhady populační šikmosti (Excel: Fisherovo g 1 a g 2, pro zajímavost)

22 11. října 2004Statistika (D360P03Z) 2. předn.22 dvojice znaků (veličin) na jedné statistické jednotce měřit dva znaky lze vyšetřovat závislost postupy (i grafické) závisí na měřítku: kvalitativní – kvalitativní kvalitativní – kvantitativní kvantitativní – kvantitativní zatím popisné charakteristiky, prokazování závislosti později

23 11. října 2004Statistika (D360P03Z) 2. předn.23 kvalitativní - kvalitativní kvalitativní data – nominální (ordinální) měřítko, vyjadřujeme pomocí četností dva znaky – četnosti možných dvojic hodnot hodnot n ij zapisujeme do kontingenční tabulky doplňujeme marginální četnosti – součty po řádcích a po sloupcích – četnosti jednotlivých znaků zvlášť oba znaky nula-jedničkové – kontingenční tabulka 2x2, čtyřpolní tabulka

24 11. října 2004Statistika (D360P03Z) 2. předn.24 příklad – vzdělání matek vzdělání porodnice celkem Prahavenkov základní231134 střední301747 VŠ17118 celkem702999

25 11. října 2004Statistika (D360P03Z) 2. předn.25 porovnání sloupců (porodnice) vzděl. porodnice Prahavenkovcelkem zákl.32,9 %37,9 %34,3 % stř.42,8 %58,6 %47,5 % VŠ24,3 %3,5 %18,2 % celk.100,0% (pozor na nestejnou orientaci)

26 11. října 2004Statistika (D360P03Z) 2. předn.26 porovnání řádků (vzdělání) vzděl. porodnice Prahavenkovcelkem zákl.67,6 %32,4 %100,0 % stř.63,8 %36,2 %100,0 % VŠ94,4 %5,6 %100,0 % celk.70,7 %29,3 %100,0 %

27 11. října 2004Statistika (D360P03Z) 2. předn.27 příklad (úvaha) kdyby rozdělení vzdělání bylo všude stejné, očekávám je v poměru 34:47:18, celkem 99 pražských je 70 matek, rozdělím-li je ve stejném poměru, dostanu 70·34/99=24,0, 70·47/99=33,2 resp. 70·18/99=12,8 stejně rozdělením 29 mimopražských v poměru 34:47:18, dostanu 9,9 resp. 13,8 resp. 5,3 jsou to očekávané četnosti = součin marginálních součtů dělený n

28 11. října 2004Statistika (D360P03Z) 2. předn.28 hodnocení četností (chí-kvadrát) 24,09,934 33,313,847 12,75,318 702999 231134 301747 17118 702999 tabelováno závislost prokázána na 5% hladině


Stáhnout ppt "11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  %"

Podobné prezentace


Reklamy Google