Viacrozmerné štatistické metódy
Čo NÁS dnes čaká? organizácia predmetu – podmienky získania zápočtu a skúšky, pravidlá vzájomnej komunikácie odporúčaná literatúra Úvod do predmetu: Vysvetlíme čo je viacrozmerná štatistická analýza a kde je ju možné aplikovať. Vymedzíme typy premenných a škály, s ktorými sa môžeme stretnúť v analýzach. Uvedieme klasifikáciu metód viacrozmerných analýz. Uvedieme metódy, ktorým počas semestra budeme venovať väčšiu pozornosť. Ukážka diplomových a vedeckých prác, v ktorých sa využívali metódy VŠA.
ORGANIZÁCIA PREDMETU výmera predmetu: 2-2 PREDNÁŠKY Stručne objasniť podstatu metódy z teoretického hľadiska, demonštrovať metódy na praktických príkladoch, prezentovať aplikáciu metód v štatistickom softvéri (SAS, Statgraphics).
ORGANIZÁCIA PREDMETU CVIČENIA účasť povinná, povolené 3 ospravedlnené absencie (lekár, vážne rodinné dôvody, reprezentácia školy, atď.) + 1 neospravedlená (mimo písomky). Neospravedlňovať neúčasť e-mailom!!! cieľ: prejsť od teórie k praxi, t.j. naučiť študentov analyzovať a interpretovať výsledky viacrozmerných analýz.
PODMIENKY ZÍSKANIA ZÁPOČTU A SKÚŠKY zápočet: účasť na cvičeniach napísané 2 písomky na 50% bodov. písomky: na základe reálnych údajov preukázať znalosti z prebratých metód (vedieť urobiť výstup a interpretovať výsledky).
PODMIENKY ZÍSKANIA ZÁPOČTU A SKÚŠKY skúška: získaný zápočet overenie teoretických znalostí výsledné hodnotenie bude pozostávať z hodnotenia: čiastkových písomiek teórie na skúške aktivity počas semestra.
PODMIENKY ZÍSKANIA ZÁPOČTU A SKÚŠKY OPRAVNÁ PÍSOMKA: Bude stanovený len 1 TERMÍN!!! v prvom, resp. druhom týždni skúšobného obdobia. Bude povolená len študentom, ktorí napísali každý priebežný test na minimálne 15 bodov. Bude obsahovať problematiku celého semestra. Ak študent získa zápočet cez opravnú písomku, tak ku skúške za priebežné testy získava 50% bodov, t.j.100 bodov. PEVNE VERÍM, ŽE TERMÍN NEBUDE POTREBNÝ!!!
Literatúra Stankovičová I. – Vojtková M.: Viacrozmerné štatistické metódy s aplikáciami. 1. vyd. Bratislava: Iura Editon, 2007 Hendl J. Přehled statistických metod zpracování dat. 2.vyd. Praha: Portál, 2009. Hebák, P. a kol. Vícerozměrné statistické metody 1-3. Praha : Informatorium, 2004. Urbánek T. (2000): Strukturální modelování v psychologii. Psychologický ústav AV ČR a Nakladatelství Pavel Křepela, Brno. Hair J. F. a kol. (1998). Multivariate Data Analysis (5th ed.). London atd.: Prentice Hall Int.
Literatúra:
Čo je viacrozmerná analýza Viacrozmerná analýza údajov (Multivariate Data Analysis ) = je tvorená všetkými štatistickými metódami, ktoré simultánne analyzujú viac premenných meraných na objektoch, ktoré sú predmetom nášho záujmu.
Viacrozmerné metódy - údaje P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 Pp 1 2 x25 3 4 5 n n > p
Typy dát a škál meraní Dáta Nemetrické alebo Kvalitatívní Metrické Kvantitatívne Nominálna škála Ordinálna škála Interval. škála Pomerová škála
Typy škál 1. Nominálne (kvalitatívne) 2. Ordinálne (poradové) – 3. Intervalové (kvantitativne) – 4. Pomerové (kvantitativne) – Pozn.: Typ škály je dôležitý pri určovaní správnej štatistickej techniky.
Nominálna škála 1. Nominálne (kvalitatívne) - tento typ údajov je bez numerických hodnôt, slúži na kategorizovanie objektov do tried . Príklad: Označenie automobilového motora výrobným číslom Obľúbená farba respondenta Typ absolvovanej strednej školy Nemá význam robiť iné matematické operácie ako vyjadrenie početnosti jednotlivých kategórií (Koľko študentov navštevovalo Obchodnú akadémiu
Ordinálna škála 2. Ordinálne (poradové) – tieto údaje vyjadrujú poradie, resp. preferencie. Má význam robiť matematické operácie, ktoré zachovávajú poradie a význam poradovej škály to nezmení. Vieme určiť, ktoré hodnoty sú viac preferované, ale nevieme určiť o koľko, vieme len povedať o koľko poradí. Príklad: atléti, ktorí dobehnú do cieľa
Kardinálna škála Kardinálna škála môže mať podobu intervalovej alebo pomerovej škály. Intervalové (kvantitativne) - majú pevnú jednotku merania, t.j. rozdiely medzi hodnotami môžu byť porovnávané (napr. teplota: rozdiel 3 stupňov znamená taký istý rozdiel na celej škále). Špecifické je postavenie nuly – nie je pevné. Nulová hodnota stupnice je len formálne definovaná a jej pozícia na číselnej osi je viacmenej ľubovoľná. Pomerové (kvantitativne) – podobná ako intervalová, ale s pevne fixovanou nulou. Tak je možné definovať pomer. Pomer je nezávislý na jednotke, v ktorej je hodnota znaku vyjadrená. Štatistické metódy, ktoré využívajú údaje na podielovej škále sú najrozšírenejšie. Na základe vybraných škál vyberáme vhodnú štatistickú metódu.
Aké úlohy riešime s použitím viacrozmerných údajov Snažíme se : nájsť štruktúru v údajoch (zistiť, ktoré druhy sa vyskytujú spolu alebo ktoré objekty sú si podobné) nájsť korelácie medzi skúmanými znakmi redukovať počet premenných klasifikovať objekty do podobných skupín
Výber metód viacrozmernej štatistickej analýzy Aký typ vzťahu sa skúma? Vzťah závislosti: Koľko premenných sa predikuje? Aká je škála závisle premenných? Aká je škála nezávisle premenných? Skúmame vzťahy mezi premennými, respondentami alebo objektami? Metódy: Metódy analýzy závislostí Metódy analýzy skrytých vzťahov Klasifikačné metódy
Viacrozmerné metódy metódy analýzy závislostí viacnásobná regresná a korelačná analýza diskriminačná analýza metódy analýzy skrytých vzťahov (zníženia dimenzie) analýza hlavných komponentov faktorová analýza klasifikačné metódy zhluková analýza
Metódy analýzy závislostí Viacrozmerné metódy nezávislé premenné závislé premenné X1 X2 X3 X4 X5 XP Y1 Y2 Y3 Y4 Y5 YR 1 2 3 4 5 n Metódy analýzy závislostí
Viacrozmerné metódy Metódy analýzy závislostí premenné možno rozdeliť do dvoch skupín cieľom je dokázať prítomnosť/neprítomnosť závislosti medzi týmito dvomi skupinami ak možno jednu skupinu označiť za závislé premenné a druhú za nezávislé, potom cieľom je určiť ako nezávislé premenné pôsobia na závislé premenné
Metódy analýzy závislostí Viacrozmerné metódy Metódy analýzy závislostí
Metódy analýzy skrytých vzťahov Viacrozmerné metódy premenné P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 PR 1 2 3 4 5 n Metódy analýzy skrytých vzťahov
Viacrozmerné metódy Metódy analýzy skrytých vzťahov premenné nemožno logicky rozdeliť do dvoch skupín na závislé a nezávislé cieľom je pochopiť alebo identifikovať prečo a ako sú premenné navzájom korelované t.j. ako sa navzájom ovplyvňujú ak sú premenné navzájom prepojené – korelované, možno rovnaký objem informácií vystihnúť menším počtom premenných – zníženie dimenzie
Metódy analýzy skrytých vzťahov Viacrozmerné metódy Metódy analýzy skrytých vzťahov
Klasifikačné metódy Viacrozmerné metódy 1 2 3 4 5 n P1 P2 P3 P4 P5 P6 premenné P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 PR 1 2 3 4 5 n Klasifikačné metódy
Viacrozmerné metódy Klasifikačné metódy v porovnaní s predchádzajúcimi metódami sú predmetom analýzy pozorovania nie premenné cieľom je identifikovať podobné pozorovania zoskupiť ich do skupín, ktoré sú vnútorne homogénne ale navzájom odlišné určiť pravidlo, podľa ktorého možno do určených skupín zaradiť ďalšie pozorovania na základe podobnosti
Viacnásobná regresia Jednoduchá metrická závisle premenná predikovaná niekoľkými nezávisle premennými (metrickými).
Faktorová analýza . . . . Analyzuje sa štruktúra vzťahov medzi veľkou množinou premenných, aby bolo možné určiť spoločné faktory.
Zhluková analýza . . . . Objekty (respondenti, produkty, firmy atď.) sa analyzujú z hľadiska ich podobnosti a určujú sa skupiny objektov (zhluky). Príklady segmentácia trhu v marketingu
Diskriminační analýza Nemetrická (nominálna) závisle premenná je predikovaná niekoľkými metrickými nezávisle premennými. Tažký prípad ochorenia, ľahký prípad ochorenia Príklady Banky: Kreditna dôvera, kreditná nedôvera Podniky efektívne, neefektívne
Cieľom dizertačnej práce bolo hodnotiť konkurencieschopnosť regiónov EÚ na úrovni NUTS 2 aplikáciou variantných prístupov. Použité metódy VŠA: PCA Faktorová analýza ZA Regresná analýza
Analýza hlavných komponentov (PCA) Použité ukazovatele, stojace na strane výstupov, vypovedajúce o výslednej úrovni konkurencieschopnosti, z ktorých bol vytvorený spoločný indikátor konkurencieschopnosti pre analyzované regióny vybraných krajín EÚ za roky 2006 a 2010. Spoločný indikátor konkurencieschopnosti je skonštruovaný zo štyroch ukazovateľov: · z hrubého domáceho produktu (GDP), · z hrubej pridanej hodnoty (GVA), · z disponibilného príjmu (DispInc), · z odmien zamestnancov (CompEmp). Každý región bol reprezentovaný aj tzv. „komponentovým skóre“, na základe ktorého sú regióny klasifikované na tri skupiny: silne konkurencieschopné, konkurencieschopné a slabo konkurencieschopné.
1. silne konkurencieschopné regióny ( nadobúdajú hodnotu väčšiu ako 1) 2. konkurencieschopné regióny ( nadobúdajú hodnotu v intervale od 1 po -1) 3. slabo konkurencieschopné regióny( nadobúdajú hodnotu menšiu ako -1)
Faktorová analýza (FA) ukazovatele, ktoré stoja na strane vstupov a reprezentujú komparatívne výhody regiónov Pri hodnotení konkurencieschopnosti na základe vstupov nehovoríme o výslednej úrovni konkurencieschopnosti ako takej, ale o komparatívnych výhodách, ktorými regióny disponujú. Cieľ spočíva v znížení dimenzie ukazovateľov a vo vytvorení menšieho počtu nemerateľných faktorov, využitých následne na viacrozmernú komparáciu regiónov.
Zvolených je nasledovných 16 ukazovateľov: · tvorba hrubého fixného kapitálu (GFCF) v € na obyvateľa, · celkové výdavky na vedu a výskum (GERD) v € na obyvateľa, · celkový počet pracovníkov vo vede a výskume (R&DPer) v % zo zamestnaných osôb, · celkový počet vedcov vo vede a výskume (R&DRes) v % zo zamestnaných osôb, · patentové prihlášky na Európsky patentový úrad (PatApp) v ks. na milión obyvateľov, · ľudské zdroje vo vede a technológií (HRST) v % z populácie, · miera zamestnanosti (EmpRate) v % z populácie, · miera nezamestnanosti (UnempRate) v % z ekonomicky aktívneho obyvateľstva, · zamestnanosť v oblasti technológií a v odvetviach náročných na vedomosti a znalosti (EmpTKISec) v % z populácie, · zamestnanosť v odvetviach poľnohospodárstva, lesníctva a rybolovu (EmpAFF) v % z populácie, · miera ekonomickej aktivity (EcAcRate) v % z populácie, · osoby vo veku 25 až 64 rokov s ukončeným vzdelaním tretieho stupňa (PerTerEd) v % z populácie, · očakávaná dĺžka života (LifeExp) v rokoch, · miera dojčenskej úmrtnosti (InfMorRate) vyjadrená v úmrtiach na 1000 živonarodených detí, · celková miera plodnosti (FerRate) vyjadrená v počte detí pripadajúcich na jednu ženu, · priemerný počet hodín týždenného pracovného času v hlavnom zamestnaní (WeekHourWork) v hodinách.
Faktory konkurencieschopnosti pre rok 2006 Výstupom FA sú 4 faktory: Kvalita ľudského potenciálu Demografia Trh práce Inovačný potenciál
Zhluková analýza (ZA) Viacrozmerná klasifikácia regiónov vybraných krajín EÚ do vzájomne si podobných skupín na základe vytvorených faktorov konkurencieschopnosti
Viacnásobná regresná a korelačná analýza (RaKA) Cieľom bolo skúmať ako vplývajú ukazovatele konkurencieschopnosti na strane vstupov na výsledné ukazovatele konkurencieschopnosti. Závislej premennej: indikátor konkurencieschopnosti (IK) Nezávislé premenné : faktory konkurencieschopnosti (F1, F2, F3 a F4) IKi = 0,96 F1i - 0,90 F2i + 0,74 F3i + 1,13 F4i + ei ,