Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562.

Slides:



Advertisements
Podobné prezentace
Program na výpočet parametrů vlhkého vzduchu
Advertisements

Využití interpolačních metod pro odhad srážkových úhrnů Autor: Aleš Koťátko Vedoucí: Lucie Juřikovská Konference Gisáček 2008.
ČASOPROSTOROVÁ ANALÝZA VYBRANÝCH ONEMOCNĚNÍ V OLOMOUCKÉM KRAJI Michael Havlík vedoucí práce: Zdena Dobešová Konference GISÁČEK.
TOOLBOX PRO ANALÝZU STRUKTURY KRAJINY
Plošná interpolace (aproximace)
Cvičení 1: Využití ploch. Zadání  Ve zvoleném území zhodnoťte změny vybraných typů využití ploch mezi lety 1896 a 2007  Ve zvoleném území zhodnoťte.
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Diplomová práce Autorka: Ing. et Ing. Zuzana Hynoušová
Statistika Vypracoval: Mgr. Lukáš Bičík
Tloušťková struktura porostu
ČESKÝ STATISTICKÝ ÚŘAD Na padesátém 81, Praha 10 Vývoj registru sčítacích obvodů České republiky jako GIS řešení.
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
Analýza kvantitativních dat II. Standardizace intenzitních ukazatelů Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace UK FHS Historická.
Autor: Michal Boroň Vedoucí diplomové práce: doc. Dr. Ing. Jiří Horák
Střední hodnoty věkového složení
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Barbora Kušová Obor: Geoinformatika HGF, VŠB-TU Ostrava 2002/2003
Autor projektu : SIRNÝ Lukáš Vedoucí projektu : Mgr.ČEŠKOVÁ Ivana
Prostorová mobilita - aspekt trvání přemístění
PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA Úvod, kombinatorika
Analýza dostupnosti území v okrese Bruntál
Statistika 2. přednáška Ing. Marcela Čapková.
doc. RNDr. František STANĚK, Ph.D.
Vedoucí projektu: Doc. Ing. Petr Rapant CSc. G 562 Petr Svoboda
Experimentální fyzika I. 2
Autor: Kateřina Konečná Vedoucí: Ing. Igor Ivan, Ph.D.
Vedoucí diplomové práce: Ing.Tomáš Peňáz Ph.D.
Základy zpracování geologických dat
Analýza rozmístění prodejen a služeb na vybraném území
Rozhodovací proces, podpory rozhodovacích procesů
Metrologie   Přednáška č. 5 Nejistoty měření.
Základy ekonometrie 4EK211
2. Vybrané základní pojmy matematické statistiky
Nástroje pro prostorovou analýzu srážek v GIS
Autor: Petr BALA Vedoucí: Dr.Ing. Jiří Horák
Základy pedagogické metodologie
Diplomová práce Dopravní dostupnost zaměstnavatelů v okrese Jeseník ve vztahu k demografickým ukazatelům Vedoucí práce: Dr.Ing. Bronislava Horáková Zpracovatel:
Diplomová práce Autor: Ondřej Renner
Využití registru sčítacích obvodů ČSÚ pro lokalizaci subjektů na úřadech práce Vedoucí projektu: doc.Dr.Ing. Jiří Horák Konzultant projektu: Ing. Libor.
DIPLOMOVÁ PRÁCE Autor projektu: Bc. Pavel Kukuliač Vedoucí projektu: doc. Dr. Ing. Jiří Horák.
Možnosti GIS při tvorbě trojrozměrných map zemětřesení Vedoucí práce: Doc.Ing.Petr Rapant CSc. Odborná konzultace: Ing. Aleš Poláček CSc. Zpracoval : Pavel.
Fakulta stavební VŠB-TU Ostrava Miroslav Mynarz, Jiří Brožovský
„ Rozšíření možností vizualizace geodat
9 Hodnocení udržovatelnosti strojů a zařízení
SHLUKOVÁ ANALÝZA FUNKČNÍCH PLOCH PRO SLEDOVÁNÍ URBÁNNÍHO VÝVOJE OLOMOUCKÉHO REGIONU Vedoucí práce: Mgr. Jana Svobodová Martin Klícha Gisáček
Analýza dojížďky studentů na VŠB – TU Ostrava
11/2003Přednáška č. 41 Regulace výpočtu modelu Předmět: Modelování v řízení MR 11 (Počítačová podpora) Obor C, Modul M8 ZS, 2003, K126 EKO Předn./Cvič.:
Návrh a implementace algoritmů pro údržbu,
Název projektu: Ostrava a okolí Zpracovatel projektu : Michal Popiolek Vedoucí projektu : Dr. Ing. Jiří Horák Odborný konzultant :Ing. Aleš Poláček Analýza.
Publikujeme s Autodesk MapGuide v.5.0 Ing. Jan Růžička, Dr. Ing. Jiří Horák VŠB-Technická univerzita Ostrava
Dopravní dostupnost obcí v okrese Nový Jičín Prezentace ročníkového projektu Dopravní dostupnost obcí v okrese Nový Jičín Autor: Petr BALA Vedoucí: Dr.Ing.
Aplikovaná statistika 2.
Časové řady Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Základní informace o předmětu1. Přednášející: RNDr. Martin Hála, CSc. katedra matematiky, B105, Další informace a soubory ke stažení.
Inf Příklady použití grafů. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Číslo.
Analýza a vyhodnocení zdravotního stavu obyvatel města TÁBOR MUDr. Stanislav Wasserbauer MUDr. Miloslav Kodl Hana Pokorná Zdravá Vysočina, o.s. ve spolupráci.
SOFTWAROVÁ PODPORA PRO VYTVÁŘENÍ FUZZY MODELŮ Knihovna fuzzy procedur Ing. Petr Želasko, VŠB-TU Ostrava.
Statistika 1.cvičení. Základní informace Ing. Daniela Krbcová Materiály ze cvičení, přednášky Skripta k předmětu,
Ukládání dat biodiverzity a jejich vizualizace
Vypracovala: Alena Šarmanová Předmět: Říční inženýrství a morfologie
Indexní analýza Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
- váhy jednotlivých studií
Homogenita meteorologických pozorování
Rutinní zdravotnická statistika
Spojitá a kategoriální data Základní popisné statistiky
Homogenita meteorologických pozorování
GIS NÁZEV DIPLOMOVÉ PRÁCE JAKO NÁSTROJ PRO PODPORU
7. Kontingenční tabulky a χ2 test
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Základy popisné statistiky
Transkript prezentace:

Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing. Pavel Hrbáček

Zadání provést souhrn a porovnání již existujících testovacích metod vyhodnotit dostupné nástroje (geostatistický modul v systému ArcInfo, dostupná řešení v ArcView a MapInfo) vyhodnocování prostoro-časového shlukování na obdržených datech (data o výskytu statisticky málo četných onemocnění)

Postup 1. Samostatné nastudování problematiky 2. Nalezení vhodných programových prostředků pro výpočet prostoro-časového shlukování 3. Provedení samotné implementace, zobrazení a vyhodnocení výsledků

Prostoro-časové shlukování cílem je posoudit, zda dochází u pozorovaných událostí současně ke shlukování v čase a v prostoru, zda platí korelace mezi vzdáleností v prostoru a časovým rozdílem v čase konání jednotlivé událostí sledování, vzájemného působení prostoru a času pro studium dynamických procesů (např. epidemiologické události apod.)

Knoxův test Definice: z n událostí je možno získat n(n-1) uspořádaných dvojic pro každý z těchto párů můžeme měřit: prostorovou vzdálenost časový interval

Knoxův test založen na porovnání pravděpodobnosti p(x) pro výskyt událostí blízkých v prostoru i v čase. Pravděpodobnost p(x) se vypočte jako: má-li p(x) příliš malou hodnotu, nelze jev považovat za náhodu, musíme odmítnout nezávislost tvorby shluků v čase a prostoru x - počet párů blízkých v prostoru a zároveň v čase

Knoxův test pokud platí předpoklad nezávislosti prostoru a času, pak pravděpodobnost X odpovídá přibližné Poissonově distribuci kde:  - intenzita výskytu S - počet událostí „blízkých v prostoru“, nastavení vhodných prostorových intervalů T - počet událostí „blízkých v čase“, nastavení vhodných časových intervalů n - počet všech událostí

Knoxův test Nutnost zvolit vhodné časové i prostorové intervaly v závislosti na datech. časové omezení - sledování diagnózy v období od roku 1977-1999, rozděleno do 6 intervalů po 4 letech od roku 1977 prostorové omezení - nejvzdálenější obce 174 000 m - rozděleno taktéž na 6 stejných intervalů

K-funkce prostorová K funkce - očekávaný počet uspořádaných párů událostí ve vzdálenosti do h časová K funkce - očekávaný počet uspořádaných párů událostí v časovém intervalu t prostoro-časová K funkce - očekávaný počet událostí ve vzdálenosti h a časovém intervalu t libovolné události, nyní standardizovanou za jednotku plochy a jednotku času

K-funkce K’(h) - výpočet K-funkce R - plocha oblasti, ve které se vyskytují pozorované události n - počet událostí v oblasti R Ih(dij) - ukazatel funkce, která je: 1 když dij =< h(zvolený interval) 0 jinak dij - vzdálenost mezi i-tými a j-tými událostmi Obdobný výpočet pro K(t) a K(h,t).

K-funkce Diference: K’(h,t) - K funkce pro prostor i čas KS‘(h) - K funkce pro prostor KT‘(t) - K funkce pro čas Jestliže jsou v datech nějaké prostoro-časové interakce, projeví se to zvýšením hodnot D‘(h,t).

Vyhodnocení dostupných nástrojů nalezení programových prostředků pro výpočet testů vhodných pro prostoro-časové shlukování: Info-Map Cluster 3.1 (volně dostupný) Stat! S-Plus Vertical Mapper naprogramování postupu pro výpočet těchto testů (Knoxův test a K funkce) v Avenue

Geostatistický modul je nyní v konečném testovacím procesu programový produkt firmy ESRI jedna z možných extenzí do programových produktů jako je ArcInfo 8.1, ArcView 8.1 a ArcEditor 8.1 pracuje na platformě Windows NT 4.0 a Windows 2000 Geostatistical Analyst dokáže používat i složité matematické metody, jako např. krigování využití nejen prostorových statistik, bodových lokalizací, ale používá se i v geologii, zemědělství, hydrologii, ekologii, atd. je nyní v konečném testovacím procesu

Datové zdroje Data z NOR (Národní onkologický registr), region severní Moravy Ročenka ústavu pro zdravotnické informace (ÚZIS) Datová sada ArcČR 500

Data Obsah: oblast severní Moravy 10 okresů, 675 obcí celkem 5484 onkologických událostí (není známo o jakou nemoc se konkrétně jedná)

Data z NOR Struktura dat z NOR: Kód obce Rok narození Rok diagnózy Počet výskytů (5484) invariantní skupina obcí (S) - doplněno ing. Vladimírem Maršíkem

Datová sada ArcČR 500 Tato sada dat zahrnuje celou oblast severní Moravy, její hranice a veškeré obce vyskytující se na tomto území - název obce PSČ kód okresu (př. 3807) kód obce (př. 554175) spojený kód okresu s kódem obce (př. 3807554175) základní územní jednotka invariantní skupina obcí (S)- doplněno ing. Maršíkem

Data ze sčítání lidu, domů a bytů (SLDB91) z roku 1991, za území severní Moravy počty obyvatel v jednotlivých obcích rozdělených na mužskou a ženskou populaci v intervalu po 5 letech, což tvořilo celkem 16 skupin (pro muže a ženy zvlášť)

Počet výskytu událostí v jednotlivých okresech severní Moravy v časovém období 1977-1999 Nejčetnější výskyt v okrese: Ostrava, Karviná Nejnižší výskyt v okrese: Jeseník

Počet výskytu událostí na území severní Moravy ve zvolených časových intervalech sledování diagnózy Lineární nárůst počtu událostí, postupně se přírůstek zmenšuje

Počet výskytu události na území severní Moravy v jednotlivých věkových kategoriích za časové období 1977-1999

Invariantní skupiny obcí - S Změny v administrativním členění státu v průběhu času byly vykompenzovány vytvořením “časově invariantních skupin obcí”. Pro každou takovou skupinu platí, že jako celek se již v průběhu času nemění. Při sestavování skupin byla brána v potaz historie obcí, respektive základních sídelních jednotek, které je tvoří veškeré výpočty provedeny na základě této hodnoty

Programové aplikace výpočet reprezentativních bodů invariantních skupin obcí výpočet SIR výpočet Knoxova testu výpočet K funkce

Výpočet reprezentativních bodů invariantních skupin obcí Pro skupiny obcí se stejným kódem S, tedy v čase invariantních skupin obcí, byl vypočten reprezentativní bod Odvozen z hodnot x-ových a y-ových souřadnic nejvzdálenějších obcí (xmax,ymax, xmin,ymin) jako jejich aritmetický průměr Reprezentační bod

Nepřímo standardizovaná incidence (SIR) použití v epidemiologii veličina, eliminující rozdíly ve věkovém složení obyvatel sledovaného území vyjádřením poměru skutečného a očekávaného počtu onemocnění ve studované populaci SIR=1 charakterizuje průměrný výskyt nádorových onemocnění SIR < 1 charakterizuje hodnoty nízkého výskytu onemocnění SIR>1 charakterizuje nadprůměrnou incidenci

Nepřímo standardizovaná incidence (SIR) ri - skutečný počet událostí ve věkové kategorii a za každou obec ei - očekávaný počet událostí ve věkové kategorii a za každou

Nepřímo standardizovaná incidence (SIR) ei – očekávaný počet událostí ai – standardní relativní incidence za celé území severní Moravy a rozdělena do věkových kategorií ni – počet žen za každou obec a zároveň rozdělených do věkových kategorií A- počet věkových kategorií

Nepřímo standardizovaná incidence (SIR) ai- standardní relativní incidence – veličina pro celé sledované území ri - počet skutečných případů za celé území severní Moravy, rozdělených do věkových kategorií ni -počet člověkoroků – počet žen za celé území severní Moravy, rozdělených do věkových kategorií po 5 letech

Nepřímo standardizovaná incidence (SIR) Standardní relativní incidence kód obce Invariantní skupina obcí Nepřímá standardizace výsledná hodnota Počet událostí v obci Očekávaný počet událostí

Nepřímo standardizovaná incidence (SIR)-vyhodnocení SIR > 4 - Slezské Rudoltice  (okres Bruntál), SIR = 4,2297. SIR > 3 - Leskovec nad Moravicí, Heřmanovcie a Roudno (okres Bruntál) Čelechovice (okres Ostrava) SIR > 2 - Bílčice, Moravský Beroun, Krasov, Malá Morávka, Karlovice (okres Bruntál) Jindřichov (okres Šumperk) Suchdol nad Odrou (okres Nový Jíčín) Slatinice (okres Olomouc) Stonava (okres Karviná) Rakov (okres Ostrava)

Thiessenovy polygony

Použití metody jádrového vyhlazování

Vyhodnocení Knoxova testu problémem při výpočtu Knoxova testu pro celé území bylo množství dat pomocná tabulka obsahovala celkem 30 068 772 možných číselných kombinací celkový výpočet Knoxova testu by na těchto datech trval několik dnů, proto byl výpočet aplikován jen vybraný okres Bruntál, jelikož se ukázal  ve výsledcích nepřímo standardizované incidence jako oblast s vysokým výskytem onkologického onemocnění

Výsledná tabulka výpočtu Knoxova testu za okres Bruntál Počet událostí vyhovující danému intervalu (kroku) - omezení časem i prostorem Počet událostí vyhovující danému intervalu - omezení prostorovým intervalem Počet událostí vyhovující danému intervalu - omezení časovým intervalem Zvolený interval pro čas Zvolený interval pro prostor Nejnižší hodnota pravděpodobnosti Nejvyšší hodnota pravděpodobnosti Výsledná tabulka výpočtu Knoxova testu za okres Bruntál

3D graf znázorňující výsledky Knoxova testu za okres Bruntál

Vyhodnocení K-funkce metoda výpočtu nebyla nejspíš příliš vhodně zvolena v závislosti na datech výsledky, které byly získány výpočtem nebyly nijak srozumitelné, nedalo se z nich vyčíst, zda dochází ke shlukování onkologických případů či nikoliv především u výpočtu diference vycházely řádově velice velké hodnoty s největší pravděpodobností by se tato metoda dala použít pro jiný typ dat

Ukázka výpočtu K funkce pro okres Bruntál Počet událostí vyhovující danému intervalu Zvolený interval pro čas K funkce pro čas diference K funkce pro čas i prostor Zvolený interval pro prostor K funkce pro prostor Ukázka výpočtu K funkce pro okres Bruntál

Programové prostředky ArcView 3.1 Avenue (programovací jazyk) Microsoft Excel

Literatura [1] Bailey T. C., Gatrell A. C.: Interactive spatial data analysis; Longman Scientific & Technical, 1995 [2] Elliot P., Cuznik J., Englist D., Stem R.: Geographical & Environmental Epidemiology [3] Maršík V. a kol.: Atlas výskytu zhoubných nádoru v České republice, Masarykův onkologický ústav v Brně, 1998 [4] Horák J.:Úvod do prostorové analýzy, učební texty, Ostrava 1998 [5] Mantel, N.: The detection of disease clustering and a generalised regression approach, Cancer Research, 1967 www.ai-geostats.org

Děkuji za pozornost