Design pokusů a hodnocení dat  Pozorování nebo experiment ?  Časté chyby  Typy analýz  Statistická literatura a software.

Slides:



Advertisements
Podobné prezentace
Sedm základních nástrojů řízení jakosti. Kontrolní tabulky Vývojové diagramy Histogramy Diagramy příčin a následků Paretovy diagramy Bodové diagramy Regulační.
Advertisements

Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Teoretické principy šlechtění a selekce Tomáš Kopec.
Genetické parametry Heritabilita, korelace. primární GP genetický rozptyl prostřeďový rozptyl kovariance sekundární GP heritabilita opakovatelnost genetické.
Biogeografie – cvičení jaro 2015 Mgr. Petr Vybral.
Analýza kvantitativních dat III. – praktické aplikace vícerozměrných statistických metod Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 2/3/2016.
STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.
Didaktická analýza dějepisného učiva Přednáška č. 6 AR 2014/2015.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
VYSOKÁ ŠKOLA TECHNICKÁ A EKONOMICKÁ ČESKÉ BUDĚJOVICE ÚSTAV PODNIKOVÉ STRATEGIE Autor bakalářské práce: Jitka Macháčková Vedoucí bakalářské práce: Ing.
„Podsklepený bytový dům 4 nadzemní podlaží cca 22 BJ “
Vysoká škola technická a ekonomická v Českých Budějovicích Ústav podnikové strategie Analýza marketingového mixu vybrané banky Autor bakalářské práce:
Analýza variance (ANOVA).
Testování hypotéz Testování hypotéz o rozdílu průměrů
Prezentace k obhajobě bakalářské práce
Procesní management v oddělení logistiky
Historická sociologie, Řízení a supervize
Číslo projektu OP VK Název projektu Moderní škola Název školy
Interpolace funkčních závislostí
7. Statistické testování
Analýza dopravní obslužnosti v Mikroregionu Jindřichohradecko
Vnitropodniková komunikace ve vybraném subjektu
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Evaluace předmětů studenty (Anketky)
Rozhodování 1.
Statistické metody a zpracování dat 1 (podzim 2016) Klára Čížková
Testování hypotéz Testování hypotéz o rozdílu průměrů
Marketingový výzkum. Marketingový výzkum Organizace marketingového výzkumu Cíl výzkumu Typ výzkumu Příprava výzkumného projektu Sběr dat Analýza výsledků.
Téma 11: Finanční plánování
Základy pedagogické metodologie
Popisný (popis reality, jevu) Vztahový (vztah jevů, faktorů, činitelů)
Základy zpracování geologických dat testování statistických hypotéz
Finanční analýza ve vybraném podniku ve vztahu k podpoře řízení
Testování hypotéz o rozdílu průměrů: Analýza rozptylu
GENETIKA POPULACÍ KVANTITATIVNÍCH ZNAKŮ 8
Zobecněné rozdíly kvalitativního a kvantitativního výzkumu
Marketingový informační systém
SIMULAČNÍ MODELY.
Základy statistické indukce
Statistické metody pro vysvětlující otázky
2. seminární úkol - projekt
Základy zpracování geologických dat testování statistických hypotéz
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Statistické metody a zpracování dat 1 (podzim 2016) Klára Čížková
Digitální učební materiál
Parametrická analýza rozptylu Kruskal-Wallisův test
SITUACE – region Zlínsko
Spojité VELIČINY Vyšetřování normality dat
PSY252 Statistická analýza dat v psychologii II
Vysoká škola technická a ekonomická v Českých Budějovicích
Analýza merchandisingu a nákupní atmosféry obchodní jednotky C&A
XII. Binomické rozložení
Úvod do praktické fyziky
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
SEM – speciální přístupy
Obědy ve Školní jídelně 5.A 2016/2017
Lineární regrese.
Analýza variance (ANOVA).
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Seminář o stavebním spoření
Seminář o stavebním spoření
Teorie chyb a vyrovnávací počet 2 (155TCV2)
Teorie chyb a vyrovnávací počet 2
Pravděpodobnost a matematická statistika I.
Transkript prezentace:

Design pokusů a hodnocení dat  Pozorování nebo experiment ?  Časté chyby  Typy analýz  Statistická literatura a software

Strategie: „Sbírej/měř všechno!“  Výhoda  Nevýhoda Škola hrou, osahám si dokonale předmět zájmu Nekonečné náměty s omezenými vzorky a metodikou Rybaření v kalných vodách neznáma Méně důsledné studium literatury (může se vymstít) Stejně nepostihnu vše Mohu „náhodou“ nalézt zajímavý vztah Není nad hypotézu …

Pozorování nebo experiment?  Manipulativní experiment  Pozorování Objekty neovlivňuji a zaznamenávám stav Manipuluji s objekty tak, abych maximalizoval vliv zkoumaného faktoru a potlačil ostatní faktory

Pozorování  Obvykle nelze potvrdit kauzalitu (nemám kontrolu) Výhody  Mohou vyplynout další otázky  Vidím - popíšu Nevýhody  Nevyžaduje přepečlivé plánování  Vliv řady dalších proměnných – slabší síla testů  Při velkém N a mnoha proměnných nejspíš něco vyjde  Tvrdou terénní prací získám již známé poznatky  V reálu přírody

Manipulativní experiment  Odhaluje kauzalitu  Další otázky mne obvykle nezajímají  Náročné na plánování, čas, prostor  Kontrola vedlejších efektů – velká síla testu (při vhodném designu)  Každé pochybení během exp. znamená ztrátu  Vzdálenější realitě přírody (zvl. v laboratoři)  Laboratoř, pozemek v dosahu Výhody Nevýhody

Rozhodnu se podle Tradice v oboru Logistické podpory Položené otázky Kdy je vhodný experiment? Poukáží výsledky pozorování na možnou kauzalitu? Oč náročnější je než pozorování? Úrovni součas. poznání

Časté chyby …

1. rok 2. rok nebo jiná lokalita

Špatný design pokusu: není kontrola (blank) současné efekty confounding effects zde rok nebo lokalita riziko chybné interpretace výsledků Nelze publikovat v seriózním časopise

Stejný problém Špatný design pokusu: confounding effects zde gradient prostředí riziko chybné interpretace výsledků Nelze publikovat v seriózním časopise

Časté chyby  Špatný design pokusu

Náhodný výběr objektů...

Časté chyby  Špatný design pokusu  Nenáhodný výběr – nereprezentuje populaci (stratifikovaně náhodný výběr)

Problém malého vzorku: - nevyvážené kategorie - riziko chyby II. druhu - slabá síla testu

Časté chyby  Špatný design pokusu  Nenáhodný výběr – nereprezentuje populaci  Malý nebo nevyvážený vzorek, chyba II. druhu – vhodná je pilotní práce

Růst vlhkosti Růst kompetice Promyšlený experiment s kontrolou a vyváženými vzorky… 2 x 4 = 8 x 2 roky = 16 ! Pseudoreplikace

Časové a prostorové pseudoreplikace nejsou opakováními, lze však s nimi pracovat.. N = 1

Časté chyby  Špatný design pokusu  Nenáhodný výběr – nereprezentuje populaci;  Pseudoreplikace – lze „napravit“ vhodnou statistikou  Nevhodná statistika (test)  Malý nebo nevyvážený vzorek, chyba II. druhu – vhodná je pilotní práce

Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny jedna Základní popis souboru Regresní modely (ANOVA, ANCOVA …) více až mnoho Nepřímá gradientová analýza, klastrová analýza Přímá gradientová analýza, diskriminační analýza Typ analýzy …

Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny Jedna Základní popis souboru Regresní modely (AN(C)OVA, G/LM, GLMIX …) více až mnoho Typ analýzy …

Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny jedna Základní popis souboru Regresní modely (AN(C)OVA, LM, GLM, GAM …) více až mnoho Typ analýzy …

Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny jedna Základní popis souboru Regresní modely (AN(C)OVA, G/LM, LME …) více až mnoho Nepřímá gradient. analýza (PCA), klastrová analýza Přímá gradient. anal. (CCA), diskriminační anal. Typ analýzy …

Mám zvládnuto...  Populace, náhodný výběr, nezávislá měření  Parametry: průměr, medián, variance, SD, SE  Stupně volnosti  Chyba I. a II. druhu  Testování H0  Síla testu  Typy rozdělení  Hladina významnosti  Transformace dat

 Analýza frekvencí, kontingenční tabulky,  2 testy  Rankování a neparametrické testy  Jedno- a vícefaktorová ANOVA, ANCOVA Další užitečné statistiky (1)  Korelace a regrese, reziduály  Vícenásobná porovnání  Vnoření (Nested, Hierarchical design) a interakce  Pevné (fixed) a náhodné (random) efekty  Obecné a zobecněné ne/lineární modely

 Repeated mesurements  (Kompletně) znáhodněné bloky  Split-plot design  Prostorové a časové autokorelace, repeatability …  Experimentální design:  BACI (Before After Control Impact)... Další užitečné statistiky (2)  Latinský čtverec

Zar J.H. 1999: Biostatistical Analysis. 4 th ed. Prentice-Hall, Inc., Upper Saddle River, NJ. 931 pp. Fowler J. & Cohen L. 1995: Practical statistics for field biology. J. Wiley & Sons, Chichester etc. 227 pp. Sokal R.R. & Rohlf F.J. 1995: Biometry: the principles and practice of statistics in biological research. 3 rd ed. Freeman & Co., New York. 887 pp.

Quinn G.P. & Keough M.J. 2002: Experimental desigh and data analysis for biologists. Cambridge Univ. Press, Cambridge. 537 pp. Crawley M.J. 2003: Statistical computing. An introduction to data analysis using S-Plus. J. Wiley & Sons, Chichester etc. 761 pp. Šmilauer P. 2007: Moderní regresní metody. Biologická fakulta JU, České Budějovice. 167 pp. (

Lepš J. & Šmilauer P. 2005: Multivariate analysis of ecological data. Biologická fakulta JU, České Budějovice. 242 pp. Lepš J. & Šmilauer P. 2005: Multivariate analysis of ecological data using CANOCO. Cambridge University Press. 269 pp. Herben T. & Münzbergová Z. 2005: Zpracování geobotanických dat v příkladech I. PřFUK, Praha. 118 pp. Lepš J. & Šmilauer P. 2000: Mnohorozměrná analýza ekologických dat. Biologická fakulta JU, České Budějovice. 102 pp.

 Základní popis, regrese  Gradientová (mnohorozm.) analýza  Klastrová analýza Software  Základní popis, regrese vč. GLM Systat, Excel Statistica S-Plus, R, SAS CANOCO Twinspan

Hodnocení (Zpracování) ekologických dat Kurzy na FŽP: Zakládání a hodnocení pokusů Základy statistiky Aplikovaná statistika V. Puš M. Šálek a kol. K. Berchová