Viacrozmerné štatistické metódy Viacrozmerné metódy všeobecne

Slides:



Advertisements
Podobné prezentace
Shluková analýza.
Advertisements

Shluková analýza.
Charakteristiky variability
Biostatistika 6. přednáška
Popisná statistika III
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Biostatistika 8. přednáška
Predikcia výsledkov futbalových zápasov pomocou NN
POMER.PRIAMA A NEPRIAMA ÚMERNOSŤ – 2. časť
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
4. cvičení
Úpravy algebrických výrazov
3. cvičení
Lineárna funkcia a jej vlastnosti
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Vonkajšie pamäťové média
Pokročilé metody analýzy dat v neurovědách
Zásoby ITMS kód projektu „Učíme inovatívne, kreatívne a hravo – učíme pre život a prax“ „Moderné vzdelávanie pre vedomostnú spoločnosť /
Súmernosti 7.ročník ZŠ Mgr. Zuzana Blašková ZŠ Staničná 13, Košice.
Skladanie síl (vektorov):
Počítačové siete, Internet, Vírusy a antivírusové programy
Pavol Nečas Gymnázium L. N. Senica Šk. rok 2008/2009 III.A
Seminárna práca z matematiky
Závislosť elektrického odporu vodiča od jeho vlastností Mgr
Priama úmernosť ISCED 2.
PaedDr. Jozef Beňuška
Plánovanie a príprava hodiny
Úvod. Porovnávanie celých čísel.
Čo je informatika? Je všeobecne veda o informáciách.
Slovné úlohy Zdroj: Križalkovič, K. a kol.: 500 riešených slovných úloh z matematiky.
Vzájomná poloha dvoch kružníc
Geografia ako veda.
doc.Ing. Zlata Sojková, CSc.
ŠTATISTIKA.
Balík protokolov TCP/IP ( Protocol Suite )
Nepriama úmernosť ISCED 2.
1.3 Gravitačná sila. Gravitačné pole.
ÚČTOVNÍCTVO Zmeny v programe v roku 2014.
Počítačové siete Miroslav Šoltés 3.A.
Magnetické pole cievky s prúdom
Základy teórie chýb.
Časticové zloženie látok
Evidencia vozidiel (Prezentácia).
Pilótové základy Cvičenie č. 11
Úvod do štatistického spracovania a vyhodnocovania údajov
Grafické riešenie lineárnej rovnice
Úvod do štatistického spracovania a vyhodnocovania údajov – 2. časť
Objemy a povrchy hranatých a rotačných telies
Vplyv únavy na kvalitu života u pacientov so sklerózou multiplex.
Obsah vyučovania Základné pojmy Výber učiva Usporiadanie učiva
Viacrozmerné štatistické metódy Faktorová analýza (FA)
Počtové operácie s celými číslami: sčítanie a odčítanie
Katedra štatistiky FHI EU v Bratislave
Blackova – Scholesova analýza
Informatika, údaj, informácia, jednotka informácie, digitalizácia
KVINTAKORDY Rachel Dudová.
Viacrozmerné štatistické metódy
INDEXY.
Podnikové hospodárstvo
Legislatívne zmeny pre rok 2015
DEKOMPOZÍCIA ČASOVÝCH RADOV
ZNALOSTNÉ SYSTÉMY prednáška č. 4
ZNALOSTNÉ SYSTÉMY prednáška č. 4
POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY
3D modelovanie Polygony
V ä z b y Chemická väzba.
Cenový model kapitálových aktív
Hromadná korešpondencia
Základy statistiky.
Transkript prezentace:

Viacrozmerné štatistické metódy Viacrozmerné metódy všeobecne Ľuboslava Uramová

Viacrozmerné metódy U1 U2 U3 U4 U5 U6 U7 U8 U9 U10 U11 Up 1 2 3 4 5 n

Metódy analýzy závislostí Viacrozmerné metódy nezávislé premenné závislé premenné X1 X2 X3 X4 X5 XP Y1 Y2 Y3 Y4 Y5 YR 1 2 3 4 5 n Metódy analýzy závislostí

Viacrozmerné metódy Metódy analýzy závislostí premenné možno rozdeliť do dvoch skupín cieľom je dokázať prítomnosť/neprítomnosť závislosti medzi týmito dvomi skupinami ak možno jednu skupinu označiť za závislé premenné a druhú za nezávislé, potom cieľom je určiť ako nezávislé premenné pôsobia na závislé premenné

Metódy analýzy závislostí Viacrozmerné metódy Metódy analýzy závislostí

Metódy analýzy skrytých vzťahov Viacrozmerné metódy premenné U1 U2 U3 U4 U5 U6 U7 U8 U9 U10 U11 UR 1 2 3 4 5 n Metódy analýzy skrytých vzťahov

Viacrozmerné metódy Metódy analýzy skrytých vzťahov premenné nemožno logicky rozdeliť do dvoch skupín na závislé a nezávislé cieľom je pochopiť alebo identifikovať prečo a ako sú premenné navzájom korelované t.j. ako sa navzájom ovplyvňujú ak sú premenné navzájom prepojené – korelované, možno rovnaký objem informácií vystihnúť menším počtom premenných – zníženie dimenzie

Metódy analýzy skrytých vzťahov Viacrozmerné metódy Metódy analýzy skrytých vzťahov

Klasifikačné metódy Viacrozmerné metódy 1 2 3 4 5 n U1 U2 U3 U4 U5 U6 premenné U1 U2 U3 U4 U5 U6 U7 U8 U9 U10 U11 UR 1 2 3 4 5 n Klasifikačné metódy

Viacrozmerné metódy Klasifikačné metódy v porovnaní s predchádzajúcimi metódami sú predmetom analýzy pozorovania nie premenné cieľom je identifikovať podobné pozorovania zoskupiť ich do skupín, ktoré sú vnútorne homogénne ale navzájom odlišné určiť pravidlo, podľa ktorého možno do určených skupín zaradiť ďalšie pozorovania na základe podobnosti

Viacrozmerné metódy Viacrozmerné metódy metódy analýzy skrytých vzťahov (zníženia dimenzie) analýza hlavných komponentov faktorová analýza klasifikačné metódy zhluková analýza metódy analýzy závislostí kanonická korelačná analýza diskriminačná analýza Viacrozmerné štatistické metódy, FHI EU

Viacrozmerné štatistické metódy Zhluková analýza Cluster Analysis (CA) Ľuboslava Uramová

Zhluková analýza Charakteristika CA rozklad súboru na niekoľko homogénnych podsúborov štatistické jednotky v jednom zhluku sú čo najpodobnejšie štatistické jednotky rôznych zhlukov sú navzájom čo najodlišnejšie zoskupiť Xi i=(1, ....n) do zhlukov c1,....cq (2 < q < n)

Zhluková analýza Postup CA výber miery vzdialenosti výber druhu zhlukovacieho postupu výber zhlukovacej metódy určenie počtu významných zhlukov interpretácia zhlukov

Zhluková analýza výber miery vzdialenosti miery podobnosti koeficienty asociácie koeficienty korelácie miery nepodobnosti - vzdialenosti pozitivita symetria trojuholníková rovnosť Euklidovská vzdialenosť Dij= (xik- xjk)2

Zhluková analýza výber druhu zhlukovacieho postupu hierarchický postup úplná analýza štatistického súboru výsledok možno zobraziť pomocou hierarchického grafu - dendrogramu aglomeratívne v prvom kroku je každá jednotka samostatným zhlukom v poslednom kroku sú všetky jednotky v jednom zhluku diverzívne v prvom kroku sú všetky jednotky v jednom zhluku v poslednom kroku každá jednotka predstavuje zhluk

Zhluková analýza výber druhu zhlukovacieho postupu nehierarchický postup vopred určený počet zhlukov iteratívny postup určenia ich stredov postupné zaraďovanie jednotiek k vybraným stredom

Zhluková analýza výber zhlukovacej metódy hierarchické – aglomeratívne metóda najbližšieho suseda (single linkage) poznáme maticu euklidovských vzdialeností kritérium spojenia = min dij vyberieme spojenie, prepočítame, atď. tzv. reťaziaci efekt

Zhluková analýza výber zhlukovacej metódy hierarchické – aglomeratívne metóda najvzdialenejšieho suseda (complete linkage) poznáme maticu euklidovských vzdialeností kritérium spojenia = max dij vyberieme spojenie, prepočítame, atď. konzistentné, izolované zhluky S1 S2 S3 S4 S5 S6 2 181 221 625 821 145 557 745 136 250 106 212 26

Zhluková analýza výber zhlukovacej metódy hierarchické – aglomeratívne metóda priemernej väzby suseda (average linkage) poznáme maticu euklidovských vzdialeností po inicializačnom spojení je vzdialenosť medzi dvomi clustrami vypočítaná ako priemer vzdialeností ich prvkov + 2

Zhluková analýza výber zhlukovacej metódy hierarchické – aglomeratívne centroidná metóda (centroid method) poznáme maticu euklidovských vzdialeností inicializačné spojenie každý zhluk je nahradený “priemerným prvkom”, ktorý sa používa pri výpočte vzdialeností nevýhodou sú inverzie mediánová metóda reprezentantom zhluku je jeho medián vylepšenie centroidnej metódy

Zhluková analýza určenie počtu významných zhlukov RMSSTD zhluku – vnútroskupinová variabilita nižšia hodnota -> nižšia variabilita -> vyššia homogenita R-Squared pomer medziskupinovej sumy štvorcov celkovej sumy štvorcov čím väčšia je medziskupinová variabilita, tým väčšie sú rozdiely medzi skupinami a tým homogénnejšie sú skupiny R2=0 – skupiny sú rovnaké R2=1 – skupiny sú rozdielne

Zhluková analýza určenie počtu významných zhlukov semipartial R-Squared (spojených zhlukov) pomer vnútroskupinová variabilita(1) – vnútroskupinová variabilita (2) celková variabilita ak je rozdiel rovný 0 -> spojené boli úplne zhodné skupiny rozdiel vyjadruje tzv. stratu homogenity vzdialenosť zhlukov (CD) ak je CD malé číslo -> spojené boli podobné skupiny CCC – cubic clustering criterium > 2

Zhluková analýza určenie počtu významných zhlukov RMSSTD - homogenita nového zhluku malé SPR – homogenita spojených zhlukov RS – heterogenita zhlukov vysoké CD – homogenita spojených zhlukov

Zhluková analýza interpretácia zhlukov dendrogram grafická analýza popisná štatistika

CA - Príklady