STATISTIKA jako vědní obor Cílem statistického zpracování dat je podání informace o vlastnostech a zákonitostech hromadných jevů. Statistika se zabývá popisem hromadných jevů - deskriptivní, popisná statistika činnostmi směřujícími k získávání dat - metody sběru dat (měření, vážení, šetření, plánovaný experiment, …) zpracováním dat - statistické zpracování (třídění dat, grafické znázornění, výpočet statistických charakteristik) analýzou dat - metody analýzy dat interpretací výsledků analýzy dat
POPISNÁ STATISTIKA Slovo STATISTIKA má latinský základ: status = stav, ale také stát = stav věcí veřejných). Tento pojem dal statistice nejen název, ale také náplň. Detailní zaznamenávání údajů souviselo s administrativním spravováním státu, kdy sčítání lidu a majetku sloužilo vojenským, daňovým a jiným účelům. Původní statistika se snaží shromáždit vyčerpávající - úplné údaje o popisovaných jevech.
Z HISTORIE STATISTIKY Několik tisíc let př. n. l. - matriky, sčítání lidu a pozemků (Čína, Egypt, Řecko, Řím) Nejstarší statistikou je dochované dílo „popis státu“ z r. 1562 (Benátky) V 17. století vznikl v Anglii směr zvaný „politická aritmetika“ - údaje o narozeních a úmrtích, snaha o číselný vývoj obyvatelstva 18. století „Statistické ročenky“ - většinou geografické údaje jako délka hranic, nejvyšší vrcholy, délka toků, … (Německo)
HISTORIE POČTU PRAVDĚPODOBNOSTI Matematici a astronomové se snaží nacházet zákonitosti v lidské společnosti a vysvětlit pomocí pravděpodobnosti to, co dřív lidé považovali za boží vůli. Zkoumání zákonů náhody začalo již v 15. a 16. století. Rozvoj teorie pravděpodobnosti začíná od poloviny 17. století a rodí se tak MATEMATICKÁ STATISTIKA Na přelomu 19. a 20. století vzniká moderní statistika analytická, induktivní
ZÁKLADNÍ STATISTICKÉ POJMY HROMADNÝ JEV Matematická statistika se zabývá metodami získávání, zpracování a vyhodnocování hromadných dat, tzn. údajů o vlastnostech velkého počtu jedinců - osob, věcí či jevů resp. jevů, které se mohou neustále opakovat, např. opakované měření sledované vlastnosti jednoho objektu Množinu všech předmětů pozorování na základě toho, že mají společné vlastnosti, nazýváme STATISTICKÝ SOUBOR a pokud je předmětem našeho zkoumání, nazýváme ho ZÁKLADNÍ SOUBOR.
ZÁKLADNÍ STATISTICKÉ POJMY STATISTICKÁ JEDNOTKA je nositelem sledovaných vlastností, které nazýváme STATISTICKÝ ZNAK (např. osoba, věc, jev) STATISTICKÝ ZNAK je obrazem sledované vlastnosti statistických jednotek ze statistického souboru (např. barva vlasů) Hodnota statistického znaku je vyjádřením stupně sledované vlastnosti (např. rezavá barva vlasů) Můžeme ji vyjádřit číslem (naměřenou hodnotou) nebo jinak (např. slovním popisem)
ZÁKLADNÍ STATISTICKÉ POJMY STATISTICKÝ SOUBOR je množina sledovaných statistických jednotek - objektů budeme rozlišovat základní statistický soubor výběrový statistický soubor ROZSAH SOUBORU je počet jednotek ve zkoumaném statistickém souboru (pozor, nepleťte s rozpětím souboru) konečný soubor (počet jednotek je pevně dán) nekonečný soubor (jednotky přibývají, např. narozené děti)
ZÁKLADNÍ STATISTICKÉ POJMY DATA jsou formou zobrazení výseku reálného světa STATISTICKÁ DATA - číselné zobrazení výseku světa, ve kterém se pozorované objekty vyskytují hromadně např. studenti vysokých škol k 1. 10. 2014 ZÁKLADNÍ SOUBOR neboli POPULACE - je takový výsek z reálného světa, který zahrnuje více objektů se společnou vlastností např. studenti VŠ v programu ERASMUS k 1. 10. 2014 VÝBĚR z populace neboli VÝBĚROVÝ SOUBOR je taková část zkoumané populace, která ji reprezentuje a splňuje vlastnost náhodnosti
Statistika jako učení o hromadných jevech Jak může statistika jako učení o hromadných jevech vypovídat něco rozumného o jednotlivci? Může! Dělá to tak, že nezkoumá jednotlivce jako celek, ale jako anonymního nositele některé vlastnosti nebo činnosti. Také Moderní statistika, která je založena na výběrové analýze, se zabývá výhradně hromadnými jevy. Zkoumá jednotlivé osoby nebo věci ne proto, aby zjistila jejich individuálnost, ale existenci nebo neexistenci nějakého znaku, který je rozložen v základním souboru. Z výsledků analýzy výběrového šetření pak lze odhadnout rozložení znaku v základním souboru (populaci).
MATEMATIKA a STATISTIKA Vztah matematiky a statistiky - matematika je nástrojem statistiky. Ernst Wagemann, PREZIDENT Říšského statistického úřadu, napsal: „Počtářské umění je jen služkou své vzdělanější paní, statistického odhadu“ Moderní statistika nazývaná MATEMATICKÁ STATISTIKA odvozuje své závěry na základě určitého matematického modelu a využívá matematického aparátu. Základem MATEMATICKÉ STATISTIKY je teorie pravděpodobnosti - usuzování z neúplných údajů zatížených náhodným kolísáním. Ernst Wagemann, PREZIDENT Říšského statistického úřadu, napsal: „Počtářské umění je jen služkou své vzdělanější paní, statistického odhadu“
STATISTICKÉ PŘÍSTUPY V souvislosti s pojmy ZÁKLADNÍ SOUBOR (POPULACE) a VÝBĚR rozlišujeme dva základní přístupy použití výsledků statistických analýz: DESKRIPTIVNÍ – získané výsledky popisují zkoumaný soubor a nesnaží se o žádné zobecnění na větší nebo jinou skupinu objektů. Jedná se o základní soubor neboli populaci. Sledované charakteristiky popisují soubor zcela přesně. INDUKTIVNÍ statistika se snaží o zobecnění (extrapolaci) výsledků na širší skupinu objektů. Pro statistickou analýzu je použitý výběr a výsledky chceme zobecnit na základní soubor - populaci.
INDUKTIVNÍ (ANALYTICKÁ) STATISTIKA ANALÝZA neboli rozbor je rozdělení celku na součásti, jejichž zkoumáním se snažíme pochopit celek INDUKCE neboli induktivní způsob uvažování je proces zobecňování poznatků, například přenášením závěrů z části na celou populaci v reálném životě je to schopnost učit se ze zkušenosti ve statistice tuto metodu nazýváme INDUKTIVNÍ neboli ANALYTICKÁ STATISTIKA, kdy na základě zkoumání vlastností výběrového souboru usuzujeme na vlastnosti základního souboru naproti tomu DEDUKCE znamená usuzování na základě obecných poznatků na partikulární
DALŠÍ STATISTICKÉ POJMY - PŘESNOST PŘESNOST je rozdíl měřené nebo počítané hodnoty od přesné Matematicky přesné a dokonalé jsou jen výpočetní metody, výsledkem jsou však odhady a pravděpodobnosti. Ve statistice je přesnost poněkud jiná než např. v bance, kde úředník počítá s haléřovými položkami Bude-li nás zajímat výška populace, budeme měřit výšku vybraných jedinců v mm? Oskar Anderson napsal: „Nemá cenu odvažovat fůru sena na chemicky přesných vahách“ „Není nic platné odhadnout vzdálenost mezi dvěma městy v tisících kroků a pak k výsledku připočítat tloušťku městských hradeb v milimetrech“
DALŠÍ STATISTICKÉ POJMY OPAKOVATELNOST udává schopnost obdržet stejné hodnoty měřením na stejném objektu nebo opakovaným pozorováním CITLIVÉ VÁHY mohou dávat přesné výsledky, které jsou však neopakovatelné NECITLIVÉ VÁHY dají opakovatelné, ale nepřesné výsledky SPOLEHLIVOST je základním pojmem při používání statistických metod a při formulaci závěru nějakého šetření (experimentu) Spolehlivost si stanovíme obvykle předem a na základě požadavku spolehlivosti musíme volit prostředky k jejímu dosažení
BIOMETRIE V BIOLOGII zkoumáme přírodní jevy, které neumíme zkoumat jako takové, ale jsme nuceni je popsat pomocí jednoho nebo více znaků tyto znaky daný jev určitým způsobem popisují - kvantifikují BIOMETRIE slouží k tomu, abychom při zkoumání jevů v biologii posoudili, s jakou spolehlivostí podchycují měřené znaky zkoumané jevy. Měřené znaky stanoví odborník z oboru zkoumaných dat. BIOMETRIE jakožto součást MATEMATICKÉ STATISTIKY navrhne metody statistického zpracování dat.
Proč se lékaři učí statistiku? Statistiku ve smyslu shromažďování dat, manipulaci s nimi a jejich kvantitativní interpretaci používá lékař z podstaty svého povolání, protože otázky, které si klade, jsou často statistického charakteru: "Je nový lék lepší než dosud užívaný? U kolika nemocných jej musíme aplikovat, abychom prokázali jeho příznivý efekt?“ Je proto dobré vědět, jakými metodami se dobrat odpovědi a co přesně výsledek analýzy znamená.
Proč se lékaři učí statistiku? Používání výpočetní techniky umožňuje každému zpracování dat pomocí náročných a donedávna prakticky neproveditelných statistických postupů. Tyto možnosti mají svou negativní stránku ve zvýšeném nebezpečí výběru nesprávné metody zpracování dat a z toho plynoucích nesprávných závěrů. V biomedicínských časopisech se ve všech článcích setkáváme s používání statistických metod. Proto jsou základní znalosti statistiky nezbytné nejen pro vlastní šetření, ale i pro studium a pochopení publikovaných výsledků výzkumu jiných odborníků.