Přehled statistických metod pro CIE

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

kvantitativních znaků
Jednovýběrové testy parametrickch hypotéz
EDA pro časové řady.
Cvičení 6 – 25. října 2010 Heteroskedasticita
Cvičení října 2010.
Lineární regresní analýza Úvod od problému
Pilotní counterfactual impact evaluation OP LZZ, oblast podpory 1.1 Představení evaluace
Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.
Návrh modelů Jan Brůha IREAS. Návrh otázek a modelů Jaký vliv měla podpora z ESF v OP LZZ 1.1 na obrat / zisk a zaměstnanost firem? – Jde o srovnání mezi.
Oto Potluka IREAS a VŠE Praha
Optimalizace v simulačním modelování. Obecně o optimalizaci  Optimalizovat znamená maximalizovat nebo minimalizovat parametrech (např. počet obslužných.
Porovnání průměrů více než dvou normálních rozdělení
Základní statistické pojmy a postupy
Varianty výzkumu Kroky výzkumu Výběrový soubor
Základy ekonometrie Cvičení září 2010.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
Sociologický výzkum.
Základy ekonometrie Cvičení 3 4. října 2010.
Optimalizace versus simulace 9.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
Simultánní rovnice Tomáš Cahlík
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
2. seminární úkol - projekt PSY117. Týmový projekt  Záměrem tohoto úkolu je vyzkoušet si realizaci jednoduchého výběrového šetření.  Pětičlenné týmy.
Lineární regresní analýza
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Základy ekonometrie 4EK211
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
TECHNIKY SBĚRU DAT KVANTITATIVNÍ KVALITATIVNÍ VÝZKUM VÝZKUM
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
Reprezentativita: chyba výběru Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Optimalizace versus simulace 8.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Metodologie 2 Lekce 1 Lenka Slepičková.
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
Základy testování hypotéz
Postup při empirickém kvantitativním výzkumu
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Ing. Jitka Nesnídalová, Ph.D. SVŠES, s.r.o. Praha
Bc. Jaromír Šetek VNÍMÁNÍ ZEMĚ PŮVODU ZNAČKY A ZEMĚ PŮVODU PRODUKTU VEDOUCÍ PRÁCE: Ing. Pavel Štrach, Ph.D. et Ph.D.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Molekulová fyzika 2. Sada pomocných snímků „Teplota“
Exoplanety Autor:Lukáš Rouša. Obsah  Exoplaneta  Metody detekce  Označení  Obecné vlastnosti  Nové obyvatelné exoplanety.
Varianty výzkumu Kroky výzkumu Výběrový soubor
MARKETING Přednáška P
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Reprezentativita: chyba výběru Jindřich Krejčí
Metody psychologie.
- váhy jednotlivých studií
Úvod do praktické fyziky
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Příklad (investiční projekt)
Úvod do statistického testování
Parciální korelace Regresní analýza
Neparametrické testy pro porovnání polohy
Název vědeckého projektu
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Náhodné výběry a jejich zpracování
Transkript prezentace:

Přehled statistických metod pro CIE Jan Brůha IREAS

Problematika z hlediska statistiky Proč a kdy jsou potřebné speciální metody? A kdy nejsou potřeba Jaké metody jsou k disposici: Regresní diskontinuita Metoda instrumentálních proměnných „propensity score matching“ (a její varianty s DD)

„Selection bias“ Naivní odhad = srovnání podpořených a nepodpořených jednotek (případně očištění o pozorované vlastnosti) Naivní odhad je součtem tří složek skutečného efektu dopadu intervence na zkoumané jednotky; vychýlení z důvodu, že jednotky které získaly podporu by měly odlišný výsledek než jednotky bez podpory i v případě, že by zásahu vystaveny nebyly; vychýlení z důvodu, že jednotky v kontrolní skupině by měly jiný výsledek, i kdyby získaly podporu, než jednotky v základní skupině vystavené zásahu.

Kdy lze ignorovat „selection bias“? Přirozený experiment: přiřazení podpory je náhodné Pozorované charakteristiky jsou dostatečné pro zachycení heterogenity mezi jednotkami Pak lze použít standardní metody regresní analýzy s dummy proměnnou parametrické nebo neparametrické metody Otázka výběru proměnných Pokud nepozorovaná heterogenita má charakter fixního efektu Pak lze použít metod panelových dat (DD / CDD estimátor)

Regresní diskontinuita Regresní diskontinuita je použitelná tehdy, pokud lze jednotky srovnat pomocí veličiny k, přičemž existuje hodnota K taková: Všechny jednotky s k>K podporu obdrží a jednotky k<K ji neobdrží (ostrá varianta) Neostrá (fuzzy) varianta: v K se skokově mění pravděpodobnost obdržení podpory Metoda vlastně srovnává jednotky kolem bodu K Důvod eliminace selection bias: rozložení firem kolem bodu K je více-méně náhodné

Regresní diskontinuita - 2 Výhody Není potřeba předpokladů o funkční závislosti efektu podpory Lze použít v podstatě lokální lineární model (neparametrická metoda) Nevýhody Je obtížné extrapolovat výsledky pro jednotky „daleko“ od K Je nutné kontrolovat pro charakteristiky firem a / nebo doby intervence (nutnost dobrých dat) Jednotky pod k<K mohly získat jinou podporu

Regresní diskontinuita - 3 Citlivostní analýza Pokud se použijí lokální lineární model, pak jak nastavit šířku „okna“ Je nutné ověřit, že skutečně dochází ke skokové změně pravděpodobnosti v K (neostrá varianta) Problematika, pokud je více druhů podpor Pokud je možné podpory ordinálně srovnat, pak na to existují speciální metody (dose function) Pokud jsou různé typy, pak se metoda komplikuje

Metoda instrumentálních proměnných Historicky nejstarší metoda vyvinutá k modelování kauzálních vztahů v ekonometrii Identifikace nabídky a poptávky Jde vlastně o nalezení proměnné, která poskytne dodatečnou variabilitu Proměnná, která je dobrým prediktorem získání podpory, ale neovlivňuje výsledek podpory Osoba evaluátora ?

Metoda instrumentálních proměnných - 2 Původně lineární model Dnes existují i neparametrické metody Very, very data hungry Použitelné, pokud je instrumentální proměnná diskrétní (případ evaluátora) Problémy Najít instrumentální proměnnou Statistická vydatnost (pokud je prediktor slabý) Nelze testovat, zda je proměnná opravdu instrumentální Leda v „metamodelu“

Propensity score matching Srovnávají se jednotky s obdobnými charakteristikami Tyto charakteristiky se transformují do jednoho čísla (0 až 1) Odhaduje se model diskrétní volby (např. logistická regrese, nebo probit), zda daná jednotka podporu obdrží nebo ne Lze rozšířit také pro více kategoriálních podpor (vícerozměrný probit) Existuje i rozšíření na spojitě-měnící se podporu

Propensity score matching - 2 Různé způsoby srovnání jednotek Podle nejbližšího souseda (nearest available) Kernel matching Je vhodné odstranit extrémní pozorování PSM úplným způsobem neodstraňuje „selection bias“ Jedná se jen o „robustnější způsob“ regresní analýzy

Propensity score matching – with CDD Kombinace PSM a CDD Abychom odhadli PSM, musíme pozorovat charakteristiky firem, Je typicky možné použít CDD místo DD CDD může pomoci odstranit vychýlení, kdežto PSM může učinit odhad robustnější Je také možné relativně jednoduše pracovat s různými typy podpor