Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Základní statistická analýza dat z pre- a klinických studií Doc. PharmDr. Miloslav Hronek, Ph.D. UK Faf Hradec Králové.

Podobné prezentace


Prezentace na téma: "Základní statistická analýza dat z pre- a klinických studií Doc. PharmDr. Miloslav Hronek, Ph.D. UK Faf Hradec Králové."— Transkript prezentace:

1 Základní statistická analýza dat z pre- a klinických studií Doc. PharmDr. Miloslav Hronek, Ph.D. UK Faf Hradec Králové

2 Obsah – Základní statistické pojmy (nejvíce používané) – Základní deskriptivní statistika (charakteristiky úrovně) – Hodnocení statisticky významné rozdílnosti souborů – Hodnocení statisticky významné souvislostí mezi daty – Excel a GraphPad Prism software

3 Proč školící seminář na dané téma – Využití základní statistiky pro vyhodnocení dat v rámci kvalifikačních prací – Špatná aplikace a interpretace výsledků daná předchozí neznalostí

4 • Statistika je dnes nezbytným nástrojem informatiky – Množství informací se ve světě stále zvyšuje. – Je proto nutné naučit se využívat statistické metody, neboť ty nám umožňují hledání souvislostí tam, kde se množství dat stalo nepřehledným.

5 Základní pojmy Statistika • Zabývá se analýzou informací, především daty – informace vyjádřenými jako měřitelné a pozorovatelné veličiny Experiment • Sběr dat s cílem něco se naučit nebo objevit

6 Základní pojmy • Proměnná • Neznámá, jako veličina – Diskrétní proměnná • Proměnná může nabývat pouze určité hodnoty – např. konkrétní hodnoty tlaku krve – Spojitá proměnná • Může nabývat nekonečně mnoho hodnot – např. okolní teplota ve stupních

7 Základní pojmy • Populace – Také základní soubor – Určitý počet položek, předmětů, úkazů… • Výběr – Také výběrový soubor – Populace je zároveň podmnožinou této populace

8 Základní pojmy • Statistický jev – jednotlivá jednotka výběru • Náhodný výběr – náhodně vybrané jednotky • Náhodná proměnná – diskrétní nebo spojitá proměnná, jejíž hodnotu nemůžeme předem určit, např. číslo od 1 do 6 u hodu kostkou

9 Základní pojmy • Četnost – udává, kolikrát se tento výsledek vyskytl v určitém výběru populace • Parametr – specifická, přesně stanovená vlastnost populace, např. hodnota glykémie

10 Charakteristiky úrovně Statistický soubor je nahrazen jen jediným číslem, – určitým způsobem je specifikuje. • Počet hodnot, minimum a maximum – nejjednodušší ukazatele • Průměry - počítané ze všech hodnot souboru • Ostatní střední hodnoty – robustní charakteristiky polohy – jsou-li v souboru extrémní (odlehlá) pozorování • Useknuté průměry, kvantily – nepočítají se ze všech hodnot souboru (část hodnot se úmyslně vynechává)

11 Základní deskriptivní statistika • Není nutný speciální software – Lze využít Excel z Microsoft Office – Lze vyhodnotit aritm. průměr, SE, SD, Min., Max., počet, Medián, Modus Nastavit pro každý parametr zvlášť • Nejčastější • Časově náročnější • Méně přehledné (dle nastavení) Nastavení Deskriptivní statistiky • Vyhodnocení najednou všech parametrů • Přehledné tabulkové zobrazení Excel

12 Excel – zavedení Analysis ToolPak

13 Deskriptivní statistika v EXCEL 1. krok

14 Deskriptivní statistika v EXCEL 2. krok

15 Deskriptivní statistika v EXCEL výsledky Ukázka v Excel

16 Hodnota (Value) Index i se nahrazuje číslem a označuje kolikátá hodnota v souboru to je. x 14 = 51 znamená, že 14. hodnota souboru je 51.

17 Aritmetický průměr Aritmetický průměr, nebo často též jen průměr, • je průměr všech hodnot ve statistickém souboru. Výpočet průměru • sečteme všechny hodnoty a vydělíme je počtem hodnot v souboru.

18 Vlastnosti aritmetického průměru – Vynásobíme-li aritmetický průměr počtem n (rozsah souboru) = suma (Σ) všech hodnot souboru. – Přičteme-li ke všem hodnotám stejnou konstantu k, je to obdoba jako když k aritm. průměru tuto konstantu přičteme – Obdobně, když vynásobíme nenulovou konstantou všechna čísla, je to obdoba jako když aritm. průměr vynásobíme stejnou konstantou – Součet jednotlivých odchylek od aritm. průměru je nulový

19 Trimmed Mean) Useknutý průměr (Trimmed Mean) ) -Odstraňuje nedostatky aritmetického průměru -Používá se k vyloučení extrémních hodnot -Výpočet průměru ze selekce hodnot -Např. se vyloučí 5 % nejnižších a 5 % nejvyšších hodnot -V Excelu = TRIMMEAN (oblast; procenta)

20 Medián (Median) • Naměřené hodnoty se seřadí podle velikosti • medián je prostřední hodnota • u sudého počtu – je mediánem průměr obou prostředních čísel – polovina prvků je větších nebo rovných mediánu a polovina je menších nebo rovna mediánu • u lichého počtu prvků – počet prvků s vyšší nebo stejnou hodnotou roven počtu prvků s menší nebo stejnou hodnotou

21 Modus (Mode) • hodnota, která se vyskytuje nejčastěji • vhodné pro větší rozsah výběru – je-li málo čísel, • čísla se opakují např. jen 2x, tedy nelze stanovit

22 Rozptyl (variance) • je to míra rozsahu, která udává, jak jsou hodnoty rozptýleny • je to jiný způsob, jak můžeme popsat povahu rozložení • průměr druhé mocniny vzdálenosti každé hodnoty od průměru • Pro výpočet je nutné znát průměr • Vypočítáme rozdíl mezi všemi naměřenými hodnotami a průměrem • Všechna tato čísla sečteme a výsledek vydělíme počtem měření sníženým o 1

23 Směrodatná odchylka SD – podobně jako rozptyl vyjadřuje, jak jsou hodnoty rozptýleny s ohledem na průměr – je druhou odmocninou rozptylu – značení kurzívou σ

24 Výběrová směrodatná odchylka SE – Pro skutečný výpočet odhadu směrodatné odchylky na empiricky zjištěné řadě čísel

25 Variační koeficient – Chceme-li posoudit, je-li variabilita malá nebo velká, porovnáme směrodatnou odchylku s průměrem – Jedná se procentuální vyjádření velikosti směrodatné odchylky vzhledem k aritmetickému průměru

26 Rozdělení Gaussova křivka – normální rozdělení – Udělat histogram (výskyt četnosti jednotlivých hodnot) – Excel umí histogram, ale ne přímo vyhodnocení normality rozložení – Ideální tvar

27 INTERVALY SPOLEHLIVOSTI u normálního rozložení – 68% interval spolehlivosti = průměr ± SD – 95% IS = průměr ± 2SD – 97,7% IS = průměr ± 3SD

28 Vyjádření výsledků deskriptivní statistiky a)U normálního rozdělení • Aritmetický průměr ± SD • Nad 30 (50) hodnot není nutný test normality b)U nenormálního rozdělení • Medián (min – max) • Týká se to především malých souborů

29 • Příklady spojitých rozdělení a) symetrické jednovrcholové rozdělení, b) dvouvrcholové rozdělení, c) pravostranně asymetrické rozdělení, d) levostranně asymetrické rozdělení

30 Hodnocení statisticky významné rozdílnosti u dvou souborů hodnot – U souborů do cca 30 hodnot provézt test normality Gaussovo rozdělení (normální) • použít parametrický • t-test Neprokázána normalita rozdělení • Použít neparametrický • Mann-Whitney test • Wilcoxonův test anone Ukázka v GraphPad Prism

31 • Excel – nemá test normality, umí histogram • Vhodnější a uživatelsky jednodušší statistický software např. GraphPad Prism (v sítí Faf) Přehled testů • Parametrické – Nepárové (netvoří související dvojici dat např. kontrola x pacienti) Test pro stejnou SDTest pro rozdílnou SD - Párový t-test (např. u stejných osob měření TK ve dvou obdobích po aplikaci léčiva) Stanovuje F-test

32 • Neparametrické – Nepárový (Mann-Whitney test) – Párový (Wilcoxonův test)

33 Hodnocení statisticky významné rozdílnosti u více jak dvou souborů hodnot • Parametrický – Nepárový - použít ANOVA test – viz GraphPad Prism • Neparametrický – Nepárový Kruskal-Wallisův test – Párový Friedmanův test

34 Hodnocení vztahů mezi parametry - korelace – Značena kurzívou r (korelační koeficient) – Může být vyjádřena pouze mezi proměnnými, které mohou být vyčísleny – Vyjadřuje se -1  r  +1 obdoba je -100 %  r  +100 % – Na jednotkách nezáleží – Korelace neznamená, že musí existovat souvislost mezi příčinou a následkem

35 Korelace Typy: Parametrický test • Pearsonova korelace Neparametrický test • Spearmanova korelace Příklad prezentace výsledku Tělesná hmotnost statisticky významně korelovala s povrchem těla (P<0,0001; r=0,95).

36 Regrese • Způsob hodnocení, určující do jaké míry jeden jev ovlivňuje druhý • ! Existence korelace mezi proměnnými nemusí vždy znamenat, že mezi nimi existuje kauzální vztah (tj. souvislost mezi příčinou a jejím důsledkem)! • Lineární a nelineární regrese

37 Jak na statistickou analýzu? • Zformulovat otázku: Co chci zjistit? • Sesbírat data. • Data uspořádat a analyzovat  z nich INFORMACE • Vyhodnotit INFORMACE  z nich POZNÁNÍ

38 Zdroje: • Gibilisco S. Statistika bez předchozích znalostí. Computer Press, Brno, 2009, s • Manuál Excel. • Manuál GraphPad Prism.

39 Děkuji za milou pozornost.


Stáhnout ppt "Základní statistická analýza dat z pre- a klinických studií Doc. PharmDr. Miloslav Hronek, Ph.D. UK Faf Hradec Králové."

Podobné prezentace


Reklamy Google