Novohradské statistické dny 20121 Poznámky k problematice určování počtu shluků Hana Řezanková Vysoká škola ekonomická v Praze.

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Výpočet zásoby porostu na zkusných plochách při požadované přesnosti
Automatické titulkování živých pořadů České televize – současný stav a výhled do budoucna Luděk Müller Katedra kybernetiky, Fakulta aplikovaných.
Aktivní domy a inteligentní regiony
Použité statistické metody
Workshop T-Mobile atlantis 18 dubna 2014 Distributed by atlantis | © Aastra 2012.
ŘEMESLO OČIMA ŽÁKŮ Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem České republiky
Karásek 2013 Příklady ekonomiky Test 1 1. Který dokument vyhotovený podle zákona o hospodaření energií obsahuje fakturované spotřeby energie? 2. Vyhláška.
2MO301 „Mezinárodní obchod“
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Téma 3: Cíle vzdělávání 4. část Pedagogika NPED034.
Hodnocení způsobilosti měřících systémů
Téma 3: Cíle vzdělávání 3. část
Lineární regresní analýza Úvod od problému
Porovnání hodnotících škál bolesti v závislosti na kognitivní funkci
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
Dynamické rozvozní úlohy
ŠVP na gymnáziích: od mírné skepse k chuti pokračovat Zkušenosti z projektu Pilot G/GP Lucie Slejšková Výzkumný ústav pedagogický v Praze.
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Téma 3: Cíle vzdělávání 2. část Pedagogika NPED034.
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Přijímací řízení pro školní rok 2011/2012 Krajský úřad Pardubického kraje odbor školství, kultury a tělovýchovy oddělení organizační a vzdělávání.
Přijímací řízení pro školní rok 2011/2012 Krajský úřad Pardubického kraje odbor školství, kultury a tělovýchovy oddělení organizační a vzdělávání.
Diplomová práce Autorka: Ing. et Ing. Zuzana Hynoušová
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
ČLOVĚK A JEHO SVĚT 2. Ročník - hodiny, minuty Jana Štadlerová ŽŠ Věšín.
Mlhavý úvod do FUZZY logiky Motivace pro použití fuzzy logiky: člověk je schopen rozhodovat a řídit systémy i na základě nepřesných informací - stroj tak.
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Vyvážení bílé barvy Oko ve spolupráci s mozkem dokáže upravit každý barevný zrakový vjem na základě zkušenosti a vzpomínek tak, aby bílá.
Kalibrační křivka, produkce charmu v EAS
Získávání informací Získání informací o reálném systému
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Program 1. pracovního semináře Financování internetizace knihoven ze strukturálních fondů Havlíčkův Brod.
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Opravdu existuje? Studentská konferece, GLOBE Games 2012, Gymnázium A.Jiráska Litomyšl.
Analýza způsobilosti procesů a výrobních zařízení
Tloušťková struktura porostu
Nejmenší společný násobek
Shlukovací algoritmy založené na vzorkování
Název školy: Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, Karlovy Vary Autor: ING. HANA MOTYČKOVÁ Název materiálu: VY_32_INOVACE_13_ROZHODOVÁNÍ.
Analýza dat.
Základy ekonometrie Cvičení září 2010.
Shluková analýza.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
8. Pravost fotografií Zdeněk Töpfer
Základy ekonometrie Cvičení října 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
FIFEI-11 Termika a termodynamika III Doc. Miloš Steinhart, UPCE 06.
Odhady parametrů základního souboru
1 Ekonomický růst a trh práce (několik postřehů) František Cvengroš Smilovice, prosinec 2004.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Hybridní kniha. INSPO HYBRIDNÍ KNIHA: nová verze kombinovaného přístupu k informacím Petr Hladík, Tomáš Gůra.
Studentská PARDUBICE
1 © Mediaresearch, a.s., 2008 NetMonitor a AdMonitoring Výsledky za říjen 2008.
FIFEI-12 Termika a termodynamika IV Doc. Miloš Steinhart, UPCE 06.
Shluková analýza.
LOGISTICKÉ SYSTÉMY /14.
Popisná statistika III
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Navigace a mapování pomocí GPS
Analýza podobnosti výsledků přijímacího řízení na FIS VŠE
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Racionalizace logistických procesů ve vybrané společnosti
Multifaktorová analýza
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

Novohradské statistické dny Poznámky k problematice určování počtu shluků Hana Řezanková Vysoká škola ekonomická v Praze

Novohradské statistické dny Obsah Motivace Ilustrace problémů Experimenty Závěr

Novohradské statistické dny Motivace Existuje velké množství koeficientů pro stanovování počtu shluků Pokud nejsou shluky výrazně oddělené, jednotlivé koeficienty mohou určovat různé počty shluků jako vhodné (pro stejná data) Řada koeficientů existuje pro fuzzy shlukovou analýzu vhodnou pro překrývající se shluky Tyto koeficienty jsou pro určování počtu shluků vhodné pouze pro výrazně oddělené shluky

Novohradské statistické dny Ilustrace Data z šetření REFLEX 2006 a 2010 Sledování podobnosti proměnných, které vyjadřují úrovně kompetencí absolventa VŠ Aplikace faktorové analýzy a využití faktorových zátěží ke shlukování proměnných Použití fuzzy shlukové analýzy (FANNY) Použití 2 koeficientů pro hodnocení shlukování: Dunnův (ve variantě základní a normalizované) průměrná obrysová šířka (obrysový koeficient)

Novohradské statistické dny Ilustrace Dunnův koeficient (též partition coefficient), normaliz. Obrysový koeficient  (pro pevné shlukování)

Novohradské statistické dny Ilustrace Data z šetření REFLEX 2006 a 2010 Kompetence dosažené a požadované zaměstnavatelem, v obou skupinách: 2006: 19 kompetencí (7 a 3bodová škála) 2010: 24 kompetencí (10 a 3bodová škála) Shlukování proměnných charakterizovaných 2006: 4 a 2 vektory faktorových zátěží 2010: 5 a 2 vektory faktorových zátěží tj. 16 datových souborů

Novohradské statistické dny Ilustrace Rok 2010 (max. počet shluků n/2 – 1 = 11) 10 úrovní 5 faktorů10 úrovní 2 faktory

Novohradské statistické dny Experimenty Generovaná data (normální rozdělení) 24 objektů, 5 proměnných Objekty z různých počtů shluků (2, 3,4, 6 a 8) Parametry rozdělení pro shluky: Střední hodnota: 10, 15 (20, 25, 30, 35, 40 a 45) Směrodatná odchylka: 1 a 2 tj. 10 datových souborů

Novohradské statistické dny Experimenty Správně 2 shluky

Novohradské statistické dny Experimenty Správně 3 shluky

Novohradské statistické dny Experimenty Správně 4 shluky

Novohradské statistické dny Experimenty Správně 6 shluků

Novohradské statistické dny Experimenty Správně 8 shluků

Novohradské statistické dny Experimenty Data REFLEX 2006 (2 faktory)

Novohradské statistické dny Závěry Kdy jsou užitečné koeficienty založené na mírách příslušnosti objektů do shluků? Při porovnání různých způsobů shlukování do stejného počtu shluků, pro stanovení počtu shluků by měl být použít též jiný typ koeficientu. Jak stanovit počet shluků v případě, kdy se shluky překrývají? Navrhnout kombinaci koeficientů pro hodnocení fuzzy a pevného shlukování.

Novohradské statistické dny Děkuji Vám za pozornost