Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.

Podobné prezentace


Prezentace na téma: "Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad."— Transkript prezentace:

1 Statistika schématicky Tomáš Mrkvička

2 Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad

3 Rozšíření základů General linear models – spojení ANOVy a regrese – mohu mít jak kategoriální prediktory tak kontinuální Generalized linear models – pozorovaná proměnná může mít jiné než normální rozdělení

4 Rozšíření časových řad ARIMA metodologie – obecné principy modelování autokorelace v časových řadách Regrese pro časové řady – pozorovaná proměnná vykazuje autokorelaci GARCH – modely časových řad s proměnnou volatilitou – finanční modely Další finanční modely

5 Kategoriální data Kontingenční tabulky – Porovnání 2 či více výběrů v kategoriálních datech Logistické modely – výsledek pozorování 0 - 1 Multinomické modely – výsledek p. 0 – 1 – 2

6 Mnoharozměrná statistika Analýza hlavních komponent – jak najít v mnoha dimenzích ty nejdůležitější kolmé směry a určit které proměnné s nimi korelují Shluková analýza – vytvoření skupin podobných případů např. zákazníků Faktorová analýza – jak zredukovat mnohorozměrná kontinuální data do méně ukazatelů a zpřehlednit interpretaci Korespondenční analýza - jak zredukovat mnohorozměrná kategoriální data do méně ukazatelů a zpřehlednit interpretaci

7 Mnoharozměrná statistika Diskriminační analýza – najde proměnné, které nejlépe dokáží rozlišit různé stavy jiné proměnné. Např. čím můžeme rozlišit zda zákazník koupí či nekoupí. Canonical correlation analysis – měří korelaci mezi dvěma skupinami proměnných. Vhodné pro dotazníky. Např. 3 otázky se vztahují ke spokojenosti v práci a 3 otázky se vztahují ke spokojenosti v rodině.

8 Mnoharozměrná statistika Reliability – U dotazníků jsou často odpovědi zatíženy určitým předsudkem. Tato metoda umožní transformovat scale odpovědí tak aby tento předsudek byl odstraněn. Classification tree – Data mining procedures. – Nerozlišuje kategoriální a spojité proměnné. Vytvoří rozhodovací strom, vytvoří řadu rozhodnutí na základě proměnných, tak abychom na konci měli všechny případy rozlišeny dle nějaké kategoriální proměnné. Algoritmus klasifikace.

9 Rozšíření general linear models Heterogenita – nehomogenní rozptyl Mixed effects – Vnořená struktura General Additive Models – Když závislost není lineární – vyhlazovací techniky


Stáhnout ppt "Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad."

Podobné prezentace


Reklamy Google