Tomáš Čížek Systém NESSTAR pro ukládání,prezentaci a analýzu sociálně-vědních dat Sociologická data a datové archivy
Program přednášky Krátká historie archivace dat ze společenskovědních výzkumů DDI jako standard popisu datových souborů Nové technologie, představení programu NESSTAR Budoucnost…
Historie archivace První archivy vznikají v 60. letech minulého století UK Data archive (1967), The Interuniversity Consortium for Political and Social Research – ICPSR (1962), Zentralarchiv (1960) V současnosti velké množství archivů po celém světě
Archivy ve světě
Vznik a vývoj DDI Potřeba standardizace popisu datových souborů v souvislosti s elektronickou archivací dat V roce 1995 vzniká DDI jako standard popisu dat (metadata), první verze v roce 2000 neustálé zdokonalování, několik verzí v současnosti 3.0
Struktura DDI DDI je velkoryse navrženo, obsahuje několik desítek položek Využívána je většinou jen část Technicky je DDI navázáno na programovací jazyk XML
Struktura DDI specifikace samotné datové dokumentace – kdo a kdy ji vytvořil (obvykle jsou to samotné archivy ukládající data) popis výzkumného projektu, v jehož rámci data vznikla popis datových souborů popis jednotlivých proměnných popis ostatních neuvedených materiálů
Co je XML ? Jazyk pro vytváření strukturovaných elektronických dokumentů Položky jsou definovány pozicí v rámci dokumentu a vztahem k ostatním položkám Není vázáno na konkrétní software, snadná přenositelnost Nekomerční, otevřený software
NESSTAR NESSTAR jako konkrétní příklad programu využívajícího DDI Vznikl v roce 1998 za podpory EU, vyvíjen norským NSD Dnes komerční platforma, užívání na základě placené licence
Co všechno NESSTAR obsahuje ? Server kde jsou data informace a data uložená Program Publisher k převodu datových souborů do formátu Nesstaru Nesstar WebView – webová stránka / program k prohlížení, analýze i stahování datových souborů
Vstup do katalogu
Informace o výzkumech – Study description
Popis proměnných – Variable description
Stažení dotazníku
Další funkce Nesstaru Kromě prohlížení metadat a proměnných Nesstar umožňuje: Vytváření kontingenčních tabulek Provádění korelační a regresní analýzy Výsledky lze zobrazit mnoha typy grafů Vytváření nových a rekódování starých proměnných K využívání těchto funkcí je nutná registrace
Registrace
Uživatelské jméno a heslo jsou automaticky posílány na uvedenou mailovou adresu
Vytváření tabulek Volba Tabulation v menu programu umožňuje vytvářet jednouchou tabulku četností jednotlivé proměnné nebo kontingenční tabulku pro více proměnných
Vytváření tabulek
Analýza Volba „Correlation“ vyvolá prázdnou korelační tabulku. Proměnné lze do analýzy přidávat ze seznamu v levém sloupci pomocí volby „Add to correlation“. Regresní analýza se provádí obdobně zvolením „Regression“. V levém sloupci zobrazujícím proměnné je pak možno vybrat nezávislou proměnnou (Add as independent variable) a proměnné závislé (Add as dependent variable).
Analýza
Grafické znázornění výsledků Typ grafu lze zvolit pomocí příslušné ikony v pravém horním rohu obrazovky.
Typy grafů Bar chart (sloupcový graf), tento typ grafu je dostupný pokud je v tabulce jedna nebo více proměnných ( a nejedná se o jedinou míru) Stacked bar chart (součtový sloupcový graf), dostupný pokud jsou v tabulce dvě a více proměnných (a žádná míra) Pie chart (výsečový graf), dostupný pokud jsou v tabulce dvě a více proměnných (a žádná míra) Box whisker (krabicový graf), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra. Pokud je v tabulce přítomna pouze míra zobrazí její frekvence s normálním rozdělením a kvartily. Confidence interval graph (graf intervalů spolehlivosti), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra
Typy grafů Bar chart – mean (sloupcový graf s průměrem), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra. Regression chart (regresní graf), dostupný pouze po provedení regresní analýzy, nahrazuje ikonu sloupcového grafu. Time series graph (graf časových řad), dostupný pouze pokud je v tabulce přítomna časová proměnná/dimenze. Scatterplot, dostupný pouze po provedení regresní analýzy, nahrazuje ikonu grafu časových řad.
Typy grafů
Další funkce
Vytváření a rekódování proměnných Systém Nesstar ve své nejnovější verzi umožňuje i vytváření nových uživatelsky definovaných proměnných. To je možné pomocí v programu předem připravených matematických a statistických operací. Po zvolení ikony „Compute“ se rozbalí nabídka jednotlivých operací.
Vytváření a rekódování proměnných
Stahování datových souborů
Nesstar ve světě Nesstar se stává univerzální platformou pro on-line prezentaci dat Všechny významné archivy mají Nesstar v provozu
ZACAT
UK DA
ICPSR
European Social Survey
Budoucnost Pojekt CESSDA-PPP Přípravná fáze podpořena EU Vytvoření integrovaného datového katalogu, ne jako jednoho velkého archivu, ale jako propojení stávajících datových knihoven
Budoucnost
Děkuji Vám za pozornost. Kontakt: