Viacrozmerné štatistické metódy

Slides:



Advertisements
Podobné prezentace
Analýza dat.
Advertisements

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA Úvod, kombinatorika
1 Úvod Cíle: Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. Vymezíme specifické techniky mnohorozměrné analýzy. Určíme pro.
Biostatistika 8. přednáška
Aplikovaná statistika 2.
Predikcia výsledkov futbalových zápasov pomocou NN
PROMILE - ‰ Mgr. Z. Burzová.
Úpravy algebrických výrazov
Lineárna funkcia a jej vlastnosti
Názov predmetu: Podnikanie v malých a stredných podnikoch
Prínos prebiehajúcich partnerstiev 2011, 2012 pre realizátorov projektov Výsledky prieskumu.
Pavol Nečas Gymnázium L. N. Senica Šk. rok 2008/2009 III.A
Fungovanie bankového systému
ZÁKLADY CESTOVNÉHO RUCHU
Priama úmernosť ISCED 2.
PaedDr. Jozef Beňuška
Sociálne skupiny, školská trieda
Účtovná uzávierka a závierka
Získavanie a spracovanie informácií
ZÁŠKOLÁCTVO Neospravedlnená neprítomnosť – úmyselná absencia vyučovania bez vedomia rodičov.
SOČ 3. roč. v prípade, že máme problém, aký výskum ku svojej teoreticke časti použijeme, môžeme vykonať sociologický, psychologický alebo edukačný (napr.
Výber maturitných predmetov
Riadenie projektového cyklu – Analýza problémov regiónu
a mnoho ďalších odborníkov zo SR, ČR a Poľska s podnetnými témami Na konferencii vystúpili primátor mesta Banská Bystrica Mgr. Peter Gogola, prof.
Výnosy podniku 1. Podstata výnosov 2. Štruktúra výnosov
Žilinská univerzita v Žiline Doplňujúce pedagogické Štúdium
Plánovanie a príprava hodiny
Projektové vyučovanie vo fyzike: 24 hodinové meranie teploty vzduchu
Vplyv výberu vysokej školy na úspešnú kariéru
Úvod. Porovnávanie celých čísel.
MATEMATICKÁ ŠTATISTIKA
Kvalitatívne heuristiky
Ceny a cenová politika 1. Ekonomická podstata ceny
Geografia ako veda.
doc.Ing. Zlata Sojková, CSc.
ŠTATISTIKA.
Nepriama úmernosť ISCED 2.
3D Modelovanie prvkov krajiny
Elektronické bankovníctvo
Ekonomický rast a konvergencia
Základy teórie chýb.
Praktická časť záverečných prác
PhDr.Mgr. Pavel Bryndzák, PhD.
JEDINEC – OSOBNOSŤ (etika)
„Okno do podnikania“ Podpora vytvárania spin-off spoločností
Pilótové základy Cvičenie č. 11
Čo je PHP- PHP (PHP: Hypertext Preprocessor) je populárny open source (prístupné zdrojové kódy) skriptovací programovací jazyk Používa najmä na programovanie.
Microsoft Office PowerPoint 2010
AKO SI UDRŽAŤ ZAMESTNANCOV
Úvod do štatistického spracovania a vyhodnocovania údajov
Grafické riešenie lineárnej rovnice
Ing. Zlatica Molčanová Košice
VZÁJOMNÁ POLOHA PRIAMKY A KRUŽNICE
Vplyv únavy na kvalitu života u pacientov so sklerózou multiplex.
Obsah vyučovania Základné pojmy Výber učiva Usporiadanie učiva
Počtové operácie s celými číslami: sčítanie a odčítanie
Dezignácia a registrácia liekov na zriedkavé ochorenia
PRACOVNÝ ČAS SKRACOVANIE ? SITUÁCIA NA TRHU PRÁCE FLEXIBILITA
Ako na vysokú školu?.
INDEXY.
Podnikové hospodárstvo
Legislatívne zmeny pre rok 2015
DEKOMPOZÍCIA ČASOVÝCH RADOV
ZNALOSTNÉ SYSTÉMY prednáška č. 4
DÁTOVÉ MODELOVANIE analýza a návrh informácií v systéme – oblasť modelovania a projektovania IS dôraz na logické entity a logické závislosti medzi týmito.
Vznik a funkcie peňazí septima.
3D modelovanie Polygony
Informatika Adriana Petríková 1.A.
Zemské magnetické pole
Viacrozmerné štatistické metódy Viacrozmerné metódy všeobecne
Transkript prezentace:

Viacrozmerné štatistické metódy

Čo NÁS dnes čaká? organizácia predmetu – podmienky získania zápočtu a skúšky, pravidlá vzájomnej komunikácie odporúčaná literatúra Úvod do predmetu: Vysvetlíme čo je viacrozmerná štatistická analýza a kde je ju možné aplikovať. Vymedzíme typy premenných a škály, s ktorými sa môžeme stretnúť v analýzach. Uvedieme klasifikáciu metód viacrozmerných analýz. Uvedieme metódy, ktorým počas semestra budeme venovať väčšiu pozornosť. Ukážka diplomových a vedeckých prác, v ktorých sa využívali metódy VŠA.

ORGANIZÁCIA PREDMETU výmera predmetu: 2-2 PREDNÁŠKY Stručne objasniť podstatu metódy z teoretického hľadiska, demonštrovať metódy na praktických príkladoch, prezentovať aplikáciu metód v štatistickom softvéri (SAS, Statgraphics).

ORGANIZÁCIA PREDMETU CVIČENIA účasť povinná, povolené 3 ospravedlnené absencie (lekár, vážne rodinné dôvody, reprezentácia školy, atď.) + 1 neospravedlená (mimo písomky). Neospravedlňovať neúčasť e-mailom!!! cieľ: prejsť od teórie k praxi, t.j. naučiť študentov analyzovať a interpretovať výsledky viacrozmerných analýz.

PODMIENKY ZÍSKANIA ZÁPOČTU A SKÚŠKY zápočet: účasť na cvičeniach napísané 2 písomky na 50% bodov. písomky: na základe reálnych údajov preukázať znalosti z prebratých metód (vedieť urobiť výstup a interpretovať výsledky).

PODMIENKY ZÍSKANIA ZÁPOČTU A SKÚŠKY skúška: získaný zápočet overenie teoretických znalostí výsledné hodnotenie bude pozostávať z hodnotenia: čiastkových písomiek teórie na skúške aktivity počas semestra.

PODMIENKY ZÍSKANIA ZÁPOČTU A SKÚŠKY OPRAVNÁ PÍSOMKA: Bude stanovený len 1 TERMÍN!!! v prvom, resp. druhom týždni skúšobného obdobia. Bude povolená len študentom, ktorí napísali každý priebežný test na minimálne 15 bodov. Bude obsahovať problematiku celého semestra. Ak študent získa zápočet cez opravnú písomku, tak ku skúške za priebežné testy získava 50% bodov, t.j.100 bodov. PEVNE VERÍM, ŽE TERMÍN NEBUDE POTREBNÝ!!!

Literatúra Stankovičová I. – Vojtková M.: Viacrozmerné štatistické metódy s aplikáciami. 1. vyd. Bratislava: Iura Editon, 2007 Hendl J. Přehled statistických metod zpracování dat. 2.vyd. Praha: Portál, 2009. Hebák, P. a kol. Vícerozměrné statistické metody 1-3. Praha : Informatorium, 2004. Urbánek T. (2000): Strukturální modelování v psychologii. Psychologický ústav AV ČR a Nakladatelství Pavel Křepela, Brno. Hair J. F. a kol. (1998). Multivariate Data Analysis (5th ed.). London atd.: Prentice Hall Int.

Literatúra:

Čo je viacrozmerná analýza Viacrozmerná analýza údajov (Multivariate Data Analysis ) = je tvorená všetkými štatistickými metódami, ktoré simultánne analyzujú viac premenných meraných na objektoch, ktoré sú predmetom nášho záujmu.

Viacrozmerné metódy - údaje P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 Pp 1 2 x25 3 4 5 n n > p

Typy dát a škál meraní Dáta Nemetrické alebo Kvalitatívní Metrické Kvantitatívne Nominálna škála Ordinálna škála Interval. škála Pomerová škála

Typy škál 1. Nominálne (kvalitatívne) 2. Ordinálne (poradové) – 3. Intervalové (kvantitativne) – 4. Pomerové (kvantitativne) – Pozn.: Typ škály je dôležitý pri určovaní správnej štatistickej techniky.

Nominálna škála 1. Nominálne (kvalitatívne) - tento typ údajov je bez numerických hodnôt, slúži na kategorizovanie objektov do tried . Príklad: Označenie automobilového motora výrobným číslom Obľúbená farba respondenta Typ absolvovanej strednej školy Nemá význam robiť iné matematické operácie ako vyjadrenie početnosti jednotlivých kategórií (Koľko študentov navštevovalo Obchodnú akadémiu

Ordinálna škála 2. Ordinálne (poradové) – tieto údaje vyjadrujú poradie, resp. preferencie. Má význam robiť matematické operácie, ktoré zachovávajú poradie a význam poradovej škály to nezmení. Vieme určiť, ktoré hodnoty sú viac preferované, ale nevieme určiť o koľko, vieme len povedať o koľko poradí. Príklad: atléti, ktorí dobehnú do cieľa

Kardinálna škála Kardinálna škála môže mať podobu intervalovej alebo pomerovej škály. Intervalové (kvantitativne) - majú pevnú jednotku merania, t.j. rozdiely medzi hodnotami môžu byť porovnávané (napr. teplota: rozdiel 3 stupňov znamená taký istý rozdiel na celej škále). Špecifické je postavenie nuly – nie je pevné. Nulová hodnota stupnice je len formálne definovaná a jej pozícia na číselnej osi je viacmenej ľubovoľná. Pomerové (kvantitativne) – podobná ako intervalová, ale s pevne fixovanou nulou. Tak je možné definovať pomer. Pomer je nezávislý na jednotke, v ktorej je hodnota znaku vyjadrená. Štatistické metódy, ktoré využívajú údaje na podielovej škále sú najrozšírenejšie. Na základe vybraných škál vyberáme vhodnú štatistickú metódu.

Aké úlohy riešime s použitím viacrozmerných údajov Snažíme se : nájsť štruktúru v údajoch (zistiť, ktoré druhy sa vyskytujú spolu alebo ktoré objekty sú si podobné) nájsť korelácie medzi skúmanými znakmi redukovať počet premenných klasifikovať objekty do podobných skupín

Výber metód viacrozmernej štatistickej analýzy Aký typ vzťahu sa skúma? Vzťah závislosti: Koľko premenných sa predikuje? Aká je škála závisle premenných? Aká je škála nezávisle premenných? Skúmame vzťahy mezi premennými, respondentami alebo objektami? Metódy: Metódy analýzy závislostí Metódy analýzy skrytých vzťahov Klasifikačné metódy

Viacrozmerné metódy metódy analýzy závislostí viacnásobná regresná a korelačná analýza diskriminačná analýza metódy analýzy skrytých vzťahov (zníženia dimenzie) analýza hlavných komponentov faktorová analýza klasifikačné metódy zhluková analýza

Metódy analýzy závislostí Viacrozmerné metódy nezávislé premenné závislé premenné X1 X2 X3 X4 X5 XP Y1 Y2 Y3 Y4 Y5 YR 1 2 3 4 5 n Metódy analýzy závislostí

Viacrozmerné metódy Metódy analýzy závislostí premenné možno rozdeliť do dvoch skupín cieľom je dokázať prítomnosť/neprítomnosť závislosti medzi týmito dvomi skupinami ak možno jednu skupinu označiť za závislé premenné a druhú za nezávislé, potom cieľom je určiť ako nezávislé premenné pôsobia na závislé premenné

Metódy analýzy závislostí Viacrozmerné metódy Metódy analýzy závislostí

Metódy analýzy skrytých vzťahov Viacrozmerné metódy premenné P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 PR 1 2 3 4 5 n Metódy analýzy skrytých vzťahov

Viacrozmerné metódy Metódy analýzy skrytých vzťahov premenné nemožno logicky rozdeliť do dvoch skupín na závislé a nezávislé cieľom je pochopiť alebo identifikovať prečo a ako sú premenné navzájom korelované t.j. ako sa navzájom ovplyvňujú ak sú premenné navzájom prepojené – korelované, možno rovnaký objem informácií vystihnúť menším počtom premenných – zníženie dimenzie

Metódy analýzy skrytých vzťahov Viacrozmerné metódy Metódy analýzy skrytých vzťahov

Klasifikačné metódy Viacrozmerné metódy 1 2 3 4 5 n P1 P2 P3 P4 P5 P6 premenné P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 PR 1 2 3 4 5 n Klasifikačné metódy

Viacrozmerné metódy Klasifikačné metódy v porovnaní s predchádzajúcimi metódami sú predmetom analýzy pozorovania nie premenné cieľom je identifikovať podobné pozorovania zoskupiť ich do skupín, ktoré sú vnútorne homogénne ale navzájom odlišné určiť pravidlo, podľa ktorého možno do určených skupín zaradiť ďalšie pozorovania na základe podobnosti

Viacnásobná regresia Jednoduchá metrická závisle premenná predikovaná niekoľkými nezávisle premennými (metrickými).

Faktorová analýza . . . . Analyzuje sa štruktúra vzťahov medzi veľkou množinou premenných, aby bolo možné určiť spoločné faktory.

Zhluková analýza . . . . Objekty (respondenti, produkty, firmy atď.) sa analyzujú z hľadiska ich podobnosti a určujú sa skupiny objektov (zhluky). Príklady segmentácia trhu v marketingu

Diskriminační analýza Nemetrická (nominálna) závisle premenná je predikovaná niekoľkými metrickými nezávisle premennými. Tažký prípad ochorenia, ľahký prípad ochorenia Príklady Banky: Kreditna dôvera, kreditná nedôvera Podniky efektívne, neefektívne

Cieľom dizertačnej práce bolo hodnotiť konkurencieschopnosť regiónov EÚ na úrovni NUTS 2 aplikáciou variantných prístupov. Použité metódy VŠA: PCA Faktorová analýza ZA Regresná analýza

Analýza hlavných komponentov (PCA) Použité ukazovatele, stojace na strane výstupov, vypovedajúce o výslednej úrovni konkurencieschopnosti, z ktorých bol vytvorený spoločný indikátor konkurencieschopnosti pre analyzované regióny vybraných krajín EÚ za roky 2006 a 2010. Spoločný indikátor konkurencieschopnosti je skonštruovaný zo štyroch ukazovateľov: · z hrubého domáceho produktu (GDP), · z hrubej pridanej hodnoty (GVA), · z disponibilného príjmu (DispInc), · z odmien zamestnancov (CompEmp). Každý región bol reprezentovaný aj tzv. „komponentovým skóre“, na základe ktorého sú regióny klasifikované na tri skupiny: silne konkurencieschopné, konkurencieschopné a slabo konkurencieschopné.

1. silne konkurencieschopné regióny ( nadobúdajú hodnotu väčšiu ako 1) 2. konkurencieschopné regióny ( nadobúdajú hodnotu v intervale od 1 po -1) 3. slabo konkurencieschopné regióny( nadobúdajú hodnotu menšiu ako -1)

Faktorová analýza (FA) ukazovatele, ktoré stoja na strane vstupov a reprezentujú komparatívne výhody regiónov Pri hodnotení konkurencieschopnosti na základe vstupov nehovoríme o výslednej úrovni konkurencieschopnosti ako takej, ale o komparatívnych výhodách, ktorými regióny disponujú. Cieľ spočíva v znížení dimenzie ukazovateľov a vo vytvorení menšieho počtu nemerateľných faktorov, využitých následne na viacrozmernú komparáciu regiónov.

Zvolených je nasledovných 16 ukazovateľov: · tvorba hrubého fixného kapitálu (GFCF) v € na obyvateľa, · celkové výdavky na vedu a výskum (GERD) v € na obyvateľa, · celkový počet pracovníkov vo vede a výskume (R&DPer) v % zo zamestnaných osôb, · celkový počet vedcov vo vede a výskume (R&DRes) v % zo zamestnaných osôb, · patentové prihlášky na Európsky patentový úrad (PatApp) v ks. na milión obyvateľov, · ľudské zdroje vo vede a technológií (HRST) v % z populácie, · miera zamestnanosti (EmpRate) v % z populácie, · miera nezamestnanosti (UnempRate) v % z ekonomicky aktívneho obyvateľstva, · zamestnanosť v oblasti technológií a v odvetviach náročných na vedomosti a znalosti (EmpTKISec) v % z populácie, · zamestnanosť v odvetviach poľnohospodárstva, lesníctva a rybolovu (EmpAFF) v % z populácie, · miera ekonomickej aktivity (EcAcRate) v % z populácie, · osoby vo veku 25 až 64 rokov s ukončeným vzdelaním tretieho stupňa (PerTerEd) v % z populácie, · očakávaná dĺžka života (LifeExp) v rokoch, · miera dojčenskej úmrtnosti (InfMorRate) vyjadrená v úmrtiach na 1000 živonarodených detí, · celková miera plodnosti (FerRate) vyjadrená v počte detí pripadajúcich na jednu ženu, · priemerný počet hodín týždenného pracovného času v hlavnom zamestnaní (WeekHourWork) v hodinách.

Faktory konkurencieschopnosti pre rok 2006 Výstupom FA sú 4 faktory: Kvalita ľudského potenciálu Demografia Trh práce Inovačný potenciál

Zhluková analýza (ZA) Viacrozmerná klasifikácia regiónov vybraných krajín EÚ do vzájomne si podobných skupín na základe vytvorených faktorov konkurencieschopnosti

Viacnásobná regresná a korelačná analýza (RaKA) Cieľom bolo skúmať ako vplývajú ukazovatele konkurencieschopnosti na strane vstupov na výsledné ukazovatele konkurencieschopnosti. Závislej premennej: indikátor konkurencieschopnosti (IK) Nezávislé premenné : faktory konkurencieschopnosti (F1, F2, F3 a F4) IKi = 0,96 F1i - 0,90 F2i + 0,74 F3i + 1,13 F4i + ei ,