Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  %

Podobné prezentace


Prezentace na téma: "11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  %"— Transkript prezentace:

1 11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  % nejmenších hodnot, ze zbytku se spočítá průměr je robustní vůči odlehlým hodnotám volí se  = 0,1 (0,15) věk matek:

2 11. října 2004Statistika (D360P03Z) 2. předn.2 příklad – rodičky vyloučí se (celá část) nejmenších a 9 největších hodnot

3 11. října 2004Statistika (D360P03Z) 2. předn.3 histogram, h = 3 (k=7) Věk matek věk četnost

4 11. října 2004Statistika (D360P03Z) 2. předn.4 vlastnosti charakteristik polohy změníme-li všechny hodnoty x i tak, že přidáme ke každé stejnou konstantu a, změní se o tutéž konstantu také charakteristika polohy (posunutí) změníme-li všechny hodnoty x i tak, že je vynásobíme kladnou konstantou b, toutéž konstantou musíme vynásobit původní charakteristiku polohy, abychom dostali charakteristiku polohy pro upravená data (změna měřítka) obecně

5 11. října 2004Statistika (D360P03Z) 2. předn.5 charakt. polohy v geo/demo (1) často známe jen průměry v dílčích souborech a četnosti: průměry se použijí jako x j *, četnosti standardně př.: věk nových profesorů/docentů UK 2002: 41 profesorů, průměrný věk 51,1 77 docentů, průměrný věk 47,8 celkový průměr: nikoliv

6 11. října 2004Statistika (D360P03Z) 2. předn.6 charakt. polohy v geo/demo (2) geografický střed - průsečík průměrné zeměpisné šířky a průměrné zeměpisné délky, průměry vážené velikostí sledovaného jevu geografický medián – obdoba mediánu, rozděluje geografické objekty do dvou disjunktních skupin hodnocená vlastnost určí váhy objektů uspořádání hodnocených znaků dáno zvolenou geografickou vlastností (např. zeměpisnou délkou)

7 11. října 2004Statistika (D360P03Z) 2. předn.7 charakteristiky variability (1) obecně přičtením stejné konstanty a (posunutím) se charakteristika variability nezmění vynásobení kladnou konstantou znamená, že stejnou konstantou nutno vynásobit charakteristiku variability měří nestejnost hodnot spojité veličiny rozpětí (jen pro výběr) kvartilové rozpětí

8 11. října 2004Statistika (D360P03Z) 2. předn.8 charakteristiky variability (2) (výběrový) rozptyl (nevyhovuje obecnému požadavku přesně) populační rozptyl  2 má ve jmenovateli n

9 11. října 2004Statistika (D360P03Z) 2. předn.9 charakteristiky variability (3) rozptyl měří průměrný čtverec vzdálenosti od průměru směrodatná odchylka: odmocnina z rozptylu vyhovuje obecnému požadavku výhoda směrodatné odchylky – stejný fyzikální rozměr jako původní data pro výběrový rozptyl z třídních četností Sheppardova korekce: odečti

10 11. října 2004Statistika (D360P03Z) 2. předn.10 příklad – věk matek rozpětí: R = 38 – 18 = 20 kvartilové rozpětí: R Q = 28 – 23 = 5 rozptyl směrodatná odchylka je 4,1

11 11. října 2004Statistika (D360P03Z) 2. předn.11 příklad – věk matek pomocí třídních četností: navíc Sheppardova korekce

12 11. října 2004Statistika (D360P03Z) 2. předn.12 charakteristiky variability (4) střední odchylka: průměr odchylek (od mediánu, někdy od průměru) střední diference: průměr vzájemných vzdáleností všech dvojic (je jich n 2 )

13 11. října 2004Statistika (D360P03Z) 2. předn.13 statistické charakteristiky v Excelu MS Excelnaše přednáška Stř. hodnota(výběrový) průměr Chyba stř. hodnoty(střední) chyba průměru Rozptyl výběruvýběrový rozptyl Rozdíl max-minrozpětí Hladina spolehlivosti poloviční délka intervalu spolehlivosti

14 11. října 2004Statistika (D360P03Z) 2. předn.14 normované char. rozptýlenosti dosud zavedené míry závisejí na volbě měřítka (např. délka v m nebo v km) hledáme charakteristiky nezávislé na měřítku nutně poměrové měřítko, kladné hodnoty variační koeficient (Giniho) koeficient koncentrace např. měří nerovnoměrnost příjmů, velikostí územních jednotek, souvisí s plochou u Lorenzovy křivky

15 11. října 2004Statistika (D360P03Z) 2. předn.15 Lorenzova křivka (věk matek)

16 11. října 2004Statistika (D360P03Z) 2. předn.16 Lorenzova křivka (obyvatelé – kraje) Lorenz curve for population (Gini=0.224)

17 11. října 2004Statistika (D360P03Z) 2. předn.17 Lorenzova křivka variační řada, kladné kumulativní součty pro j = 0, 1, …, n úsečkami spojit body (j = 0, 1, …, n) zajímá nás plocha nad touto lomenou křivkou a pod úhlopříčkou jednotkového čtverce Giniho koeficient koncentrace je dvojnásobkem této plochy lze vzít v úvahu i váhy (četnosti)

18 11. října 2004Statistika (D360P03Z) 2. předn.18 příklad: obyvatelé jx (j) tjtj j /ntj /ntj /n 0-00, ,0710, ,1430, ,2140, ,2860, ,3570, ,4290, ,000

19 11. října 2004Statistika (D360P03Z) 2. předn.19 příklad: obyvatelé

20 11. října 2004Statistika (D360P03Z) 2. předn.20 z-skór, standardizace variační koeficient, Giniho koeficient příkladem bezrozměrných veličin z-skór dostaneme nulový průměr, jednotkový rozptyl bezrozměrný umožní srovnávat různě obtížné testy, …

21 11. října 2004Statistika (D360P03Z) 2. předn.21 šikmost, špičatost šikmost – průměr z 3. mocnin z-skórů špičatost – průměr ze 4. mocnin z-skórů (někdy se ještě odečítá 3) někdy se počítají odhady populační šikmosti (Excel: Fisherovo g 1 a g 2, pro zajímavost)

22 11. října 2004Statistika (D360P03Z) 2. předn.22 dvojice znaků (veličin) na jedné statistické jednotce měřit dva znaky lze vyšetřovat závislost postupy (i grafické) závisí na měřítku: kvalitativní – kvalitativní kvalitativní – kvantitativní kvantitativní – kvantitativní zatím popisné charakteristiky, prokazování závislosti později

23 11. října 2004Statistika (D360P03Z) 2. předn.23 kvalitativní - kvalitativní kvalitativní data – nominální (ordinální) měřítko, vyjadřujeme pomocí četností dva znaky – četnosti možných dvojic hodnot hodnot n ij zapisujeme do kontingenční tabulky doplňujeme marginální četnosti – součty po řádcích a po sloupcích – četnosti jednotlivých znaků zvlášť oba znaky nula-jedničkové – kontingenční tabulka 2x2, čtyřpolní tabulka

24 11. října 2004Statistika (D360P03Z) 2. předn.24 příklad – vzdělání matek vzdělání porodnice celkem Prahavenkov základní střední VŠ17118 celkem702999

25 11. října 2004Statistika (D360P03Z) 2. předn.25 porovnání sloupců (porodnice) vzděl. porodnice Prahavenkovcelkem zákl.32,9 %37,9 %34,3 % stř.42,8 %58,6 %47,5 % VŠ24,3 %3,5 %18,2 % celk.100,0% (pozor na nestejnou orientaci)

26 11. října 2004Statistika (D360P03Z) 2. předn.26 porovnání řádků (vzdělání) vzděl. porodnice Prahavenkovcelkem zákl.67,6 %32,4 %100,0 % stř.63,8 %36,2 %100,0 % VŠ94,4 %5,6 %100,0 % celk.70,7 %29,3 %100,0 %

27 11. října 2004Statistika (D360P03Z) 2. předn.27 příklad (úvaha) kdyby rozdělení vzdělání bylo všude stejné, očekávám je v poměru 34:47:18, celkem 99 pražských je 70 matek, rozdělím-li je ve stejném poměru, dostanu 70·34/99=24,0, 70·47/99=33,2 resp. 70·18/99=12,8 stejně rozdělením 29 mimopražských v poměru 34:47:18, dostanu 9,9 resp. 13,8 resp. 5,3 jsou to očekávané četnosti = součin marginálních součtů dělený n

28 11. října 2004Statistika (D360P03Z) 2. předn.28 hodnocení četností (chí-kvadrát) 24,09,934 33,313,847 12,75, tabelováno závislost prokázána na 5% hladině


Stáhnout ppt "11. října 2004Statistika (D360P03Z) 2. předn.1 charakteristiky polohy (5) alfa-useknutý průměr: nejprve se oddělí (usekne) 100  % největších a 100  %"

Podobné prezentace


Reklamy Google