Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Ing. Marcela Čapková. Základní statistické pojmy Popisná statistika (deskriptivní) – Zabývá se sběrem údajů o všech prvcích nějaké přesně vymezené skupiny.

Podobné prezentace


Prezentace na téma: "Ing. Marcela Čapková. Základní statistické pojmy Popisná statistika (deskriptivní) – Zabývá se sběrem údajů o všech prvcích nějaké přesně vymezené skupiny."— Transkript prezentace:

1 Ing. Marcela Čapková

2 Základní statistické pojmy Popisná statistika (deskriptivní) – Zabývá se sběrem údajů o všech prvcích nějaké přesně vymezené skupiny (například o všech obyvatelích jistého regionu) a jejich zpracování. Matematická statistika – Je věda, zabývající se induktivními metodami určování vlastností celého statistického souboru.

3 Základní soubor, statistický znak, statistická jednotka Základní soubor – Definice: Základní soubor je určitá, věcně, prostorově a časově vymezená množina všech zkoumaných prvků, u kterých zjišťujeme hodnoty jisté sledované veličiny. Sledovaná veličina se nazývá statistický znak. Prvky základního souboru nazýváme statistické jednotky. – Základním souborem je určitá množina prvků (osob, zvířat, automobilů, území, podniků, událostí, materiálů, chemických prvků atd.) – Př.: Studenti, kteří ve školním roce 2008/2009 skládali zkoušku z matematiky na BIVŠ. – Prvky základního souboru musí splňovat 3 podmínky: 1.Věcné vymezení Společné vlastnosti, jimiž se každý prvek souboru musí projevovat a které musí být u každého souboru stejné. Osoby skládající zkoušku z matematiky. 2.Časové vymezení Období, do kterého musí zkoumané statistické jednotky patřit. Studenti skládají zkoušku z matematiky ve školením roce 2008/ Prostorové vymezení Určení regionu nebo místa, kde bude statistický průzkum (statistické šetření) probíhat. Sledujeme jen ty osoby, které studovali na BIVŠ.

4 Statistický znak, statistická jednotka Statistický znak – Všechny prvky základního souboru se musí vyznačovat statistickým znakem (veličinou), který vyšetřujeme. – Prvek, který tento znak nemá, do souboru nepatří. Statistická jednotka – Statistické jednotky jsou nositeli vlastností základního souboru. – Některé vlastnosti statistických jednotek musí být shodné – podle nich rozhodujeme, zda skutečně statistická jednotka do souboru patří nebo ne. – Jiné vlastnosti jsou potom předmětem statického setření – jsou tedy statistickými znaky.

5 Kvalitativní a kvantitativní znak Kvalitativní znak – Demografický průzkum obyvatelstva ČR v roce Základní soubor – obyvatelé ČR Statistické jednotky – jednotlivé osoby Statistické znaky – Národnost, rodinný stav, nejvyšší dosažené vzdělání. Kvantitativní znak – Průzkum peněžních vydání domácností v ČR. Základní soubor – Všechny domácností ČR Statistické jednotky – domácnosti Statistické znaky – Vydání za potraviny, vydání za průmyslové zboží, služby, splátky, méně obvyklá vydání mohou být zahrnuta do položky ostatní vydání. – Uvedené znaky jsou kvantitativní a vyjadřují se v korunách.

6 Statistické značení X- veličina představující statistický znak - může nabývat mnoha různých hodnot x i - konkrétní hodnoty, kterých může statistika nabývat (hodnoty statistického znaku) n- počet prvků tvořící základní soubor n i - počet prvků základního souboru, majících hodnotu statistického znaku x i, absolutní četnosti, p i - relativní četnosti z i - reprezentant (zástupce) intervalu, se kterým provádíme výpočty Ze zkoušky ze statistiky získali studenti BIVŠ následující známky: – 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; X - známka z matematiky (statistický znak) x i - známky n i - počty studentů 1x1x1 2n1n1 2x2x2 4n2n2 3x3x3 3n3n3 4x4x4 1n4n4  Celkem *10n

7 Absolutní četnosti Třídní četnost (skupinová četnost) – Počet jednotek, které jsou zahrnuty do jednotlivých tříd (intervalů). – Značíme je písmenem n i. – Celková četnost je souhrnem třídních (skupinových) četností, značíme ji n. – (0 ≤ n i ≤ N) x i - známkyn i - počty studentůx i * n i  Celkem (  x i * n i )

8 Relativní četnosti Relativní četnosti p i vyjadřují strukturu souboru, získají se jako podíl: Vlastnosti relativních četností: – – p i = 1 … jev jistý – p i = 0 … jev nemožný V praxi se někdy násobí relativní četnosti 100; relativní četnost je pak vyjádřena v procentech (%)

9 Relativní četnosti x i - známkyn i - počty studentů (absolutní četnosti) p i - počty studentů (relativní četnosti - n i /n) Způsob výpočtu p i - počty studentů (relativní četnosti) 120,22/10 240,44/10 330,33/10 410,11/10  Celkem 101,0 

10 Třídění Výsledkem statistického šetření bývá mnoho údajů (hodnot statistického znaku). Výsledky nebývají zapsány v použitelné formě. Proto přepisujeme údaje tak, aby forma zápisu co nejlépe vyhovovala našim potřebám. Třídění = logické uspořádání náhodného výběru do určitých skupin, nazývaných třídy.

11 Třídění TŘÍDY MOHOU BÝT TVOŘENY – PŘÍMO HODNOTAMI pokud náhodný výběr obsahuje málo různých hodnot každá hodnota statistického znaku určuje třídu. – INTERVALY pokud je v náhodném výběru mnoho různých hodnot jsou třídy určeny intervaly Počet intervalů navrhneme dle Sturgesova pravidla: – Toto pravidlo často nelze striktně dodržet. – Je nutné přihlédnout k charakteru naměřených dat i ke zvolené délce intervalu. – Při volbě počtu intervalů, je vhodné seskupit hodnoty do 6 – 7 intervalů. – Větší počet intervalů než 7 opět znepřehledňuje zatříděný soubor. Třídní znak (reprezentant; z i ) – Je hodnota, zastupující při výpočtech příslušnou třídu (interval). – Existuje více způsobů určení třídního znaku. – Nejjednodušším (ale ne příliš přesným) způsobem, je považovat za třídní znak střed příslušného intervalu. – Střed intervalu stanovíme pomocí aritmetického průměru.

12 Třídění přímo hodnotami: Zjišťovali jsme známky udělené 10ti studentům BIVŠ ze zkoušky z matematiky ve školním roce 2008/2009. Proveďte rozdělení údajů do tříd a sestrojte vhodný typ grafu. Byly zjištěny tyto známky: 3; 2; 4; 2; 3; 1; 2; 3; 4; 2; xixi nini pipi 110,1 240,4 330,3 420,2 Celkem101,0

13 Polygon četností (spojnicový graf) Na ose x jsou znázorněny hodnoty kvantitativního znaku. Na ose y jsou odpovídající absolutní (n i ) resp. relativní (p i ) četnosti. Graf, spojující body o souřadnicích [x i ; n i ], případně [x i ; p i ] pro i = 1, 2, …, k. První souřadnicí je hodnota kvantitativního znaku - x i. Druhou souřadnicí je četnost (absolutní, relativní) - n i.

14 Třídění pomocí intervalů: Zjišťovali jsme počet získaných bodů 10ti studentů BIVŠ ze zkoušky z matematiky ve školním roce 2008/2009. Proveďte rozdělení údajů do tříd a sestrojte vhodný typ grafu. Student mohl v testu získat maximálně 100 bodů. Získané body: 42; 59; 82; 28; 31; 19; 9; 91; 72; 51; Počet intervalů: k = 1 + 3,3 * log n = 1 + 3,3 * log 10 = 4,3 5 tříd (intervalů) k - počet tříd  x i ; x i+1  zizi nini pipi 1<0;20)1020,2 2<20;40)3020,2 3<40;60)5030,3 4<60;80)7010,1 5<80;100)9020,2 Celkem**101,0

15 Histogram (sloupcový graf) Na ose x jsou znázorněny intervaly představující třídy. Na ose y jsou odpovídající absolutní (n i ) resp. relativní (p i ) četnosti. Nad každým intervalem je sestrojen obdelník, jehož výška odpovídá absolutní (relativní) četnosti.

16 Náhodný výběr Cíl statistického zkoumání – poznání vlastností základního souboru. Základní soubor má často velký rozsah – zkoumání všech jeho prvků by bylo často neuskutečnitelné, pracné, či nákladné. Proto se statistické zjišťování realizuje jen u – vybraných prvků (na vzorku) Tyto vybrané prvky ze základního souboru tvoří: – výběrový soubor, nebo-li výběr – Výběr by měl být co nejlepším představitelem základního souboru, ze kterého byl vytvořen Na základně poznání vlastností výběrového souboru se usuzuje na vlastnosti celého základního soboru – Tomuto postupu uvažování se říká statistická indukce (uvažování z části na celek)

17 Reprezentativní výběr Podmínky reprezentativního výběru 1.Jednotlivé prvky základního souboru (statistické jednotky) jsou vybírány nezávisle na sobě. 2.Všechny prvky pocházejí ze stejného základního souboru. 3.Každý prvek základního souboru má stejnou možnost dostat se do výběru

18 Výběrové charakteristiky polohy Určují přibližně polohu hodnot náhodného výběru (a tím i základního souboru) na číselné ose.

19 Výběrové charakteristiky polohy pro nezatříděný soubor Nechť máme 6 studentů Střední průmyslové školy. Zjišťovali jsme, jaké získali známky z matematiky. StudentZnámka z matemati ky A (Adam)2 B (Bohuslav)2 C (Ctirad)2 D (Daniel)3 E (Emil)4 F (Filip)5 Celkem18

20 Výběrové charakteristiky variability Říkají, jak se jednotlivé hodnoty statistického znaku liší od sebe navzájem. Odlišnost jednotlivých hodnot nazýváme – Variabilita nebo měnlivost R = X max - X min

21 Výběrové charakteristiky variability – nezatříděný soubor Nechť máme 6 studentů Střední průmyslové školy. Zjišťovali jsme, jaké získali známky z matematiky. StudentZnámka z matemati ky A (Adam)2 B (Bohuslav)2 C (Ctirad)2 D (Daniel)3 E (Emil)4 F (Filip)5 Celkem18

22 Výběrové charakteristiky variability pro nezatříděný soubor Student Známka (xi) (xi -  x) (xi -  x) ² |xi -  x|(xi -  x) 3 (xi -  x) 4 A (Adam)22-3,00-1,001,00 -1,001,00 B (Bohuslav)22-3,00-1,001,00 -1,001,00 C (Ctirad)22-3,00-1,001,00 -1,001,00 D (Daniel)33-3,000,00 E (Emil)44-3,001,00 F (Filip)55-3,002,004,002,008,0016,00 Celkem1800,008,006,00 20,00

23 Charakteristiky variability Rozptyl Směrodatná odchylka Absolutní odchylka Variační koeficient Variační rozpětí R = X MAX – X MIN = = 3 Koeficient šikmosti (asymterie) Koeficient špičatosti (excesu)

24 Výpočet charakteristik pro zatříděný soubor Pomocný výpočet pro: n xx s²s² ASkSk EkEk Známka (xi) Počet studentů (ni) xi*ni (xi -  x)ni(xi -  x)(xi -  x) ²ni |xi -  x|ni(xi -  x) 3 ni(xi -  x) 4 ni 122-4,12-2,068,484,12-17,4535, ,18-1,063,363,18-3,563, ,24-0,060,010,240, ,530,947,097,536,676,28 Celkem17520,00-2,2418,9415,06-14,3545,98 Byl zjišťován prospěch z matematiky studentů 1. ročníku studijní skupiny 1BP-VS na BIVŠ v roce Tabulka udává zjištěné údaje.

25 Kvantily Kvantil je hodnota proměnné, kdy – hodnoty které jsou menší (a stejné), tvoří určitou stanovenou část rozsahu statistického souboru. Např.: 1 %; 25 %; 50 %; 90 % apod. – Hodnoty, které jsou větší (a stejné), tvoří zbývající část rozsahu souboru. Např.: 99 %; 75 %; 50 %; 10% apod. Mezi nejčastěji používané kvantily patří: – Kvartily, – Decily, – Percentily.

26 Kvartily Jsou 3 hodnoty proměnné, které rozdělují neklesající řadu hodnot proměnné na 4 stejné části. – 1. kvartil = dolní kvartil x 25 je 25 % kvantil, odděluje 1/4 statistických jednotek s nejnižší hodnotou proměnné x od ¾ jednotek s vyšší (stejnou) hodnotou proměnné x. – 2. kvartil = prostřední kvartil = medián x 50 je 50 % kvantil. – 3. kvartil = horní kvartil x 75 je 75 % kvantil.

27 Decily Tvoří 9 hodnot proměnné, které rozdělují neklesající řadu hodnot proměnné na 10 stejně četných částí: – 1. decil x 10 … je 10 % kvantil, – 2. decil x 20 … je 20 % kvantil, – 3. decil x 30 …je 30 % kvantil, … … – 9. decil x 90 …je 90 % kvantil.

28 Percentily Tvoří 99 hodnot proměnné, které rozdělují neklesající řadu hodnot proměnné na 100 stejně četných částí: – 1. percentil…je 1 % kvantil – 2. percentil…je 2 % kvantil … … – 99. percentil… je 99 % kvantil

29 Výpočet kvantilů Pokud hledáme stanovujeme jakoukoliv hodnotu kvantilu, musíme mít vždy hodnoty náhodného seřazeny do neklesající posloupnosti. Tzn. Hodnoty musí být seřazeny podle velikosti od nejmenší hodnoty po největší.

30 Výpočet kvantilů z intervalového rozdělení četností Vzorec pro výpočet:; kde: x p = hodnota hledaného kvantilu, x d = dolní hranice intervalu, x h = horní hranice intervalu, i d = kumulativní relativní četnost odpovídající x d, i h = kumulativní relativní četnost odpovídající x h.

31 Výpočet kvantilů z intervalového rozdělení četností

32

33 Výpočet kvantilů v případě zadaného absolutního výčtu prvků Vzorec pro výpočet:; kde: z p = pořadí hledaného kvantilu, n= rozsah základního souboru (rozsah náhodného výběru) p = % hledaného kvantilu, kolika procentní kvantil hledáme.

34 Výpočet kvantilů v případě zadaného absolutního výčtu prvků

35

36 Výpočet kvantilů

37

38


Stáhnout ppt "Ing. Marcela Čapková. Základní statistické pojmy Popisná statistika (deskriptivní) – Zabývá se sběrem údajů o všech prvcích nějaké přesně vymezené skupiny."

Podobné prezentace


Reklamy Google