Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilZuzana Křížová
1
Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing. Pavel Hrbáček
2
Zadání provést souhrn a porovnání již existujících testovacích metod
vyhodnotit dostupné nástroje (geostatistický modul v systému ArcInfo, dostupná řešení v ArcView a MapInfo) vyhodnocování prostoro-časového shlukování na obdržených datech (data o výskytu statisticky málo četných onemocnění)
3
Postup 1. Samostatné nastudování problematiky
2. Nalezení vhodných programových prostředků pro výpočet prostoro-časového shlukování 3. Provedení samotné implementace, zobrazení a vyhodnocení výsledků
4
Prostoro-časové shlukování
cílem je posoudit, zda dochází u pozorovaných událostí současně ke shlukování v čase a v prostoru, zda platí korelace mezi vzdáleností v prostoru a časovým rozdílem v čase konání jednotlivé událostí sledování, vzájemného působení prostoru a času pro studium dynamických procesů (např. epidemiologické události apod.)
5
Knoxův test Definice: z n událostí je možno získat n(n-1) uspořádaných dvojic pro každý z těchto párů můžeme měřit: prostorovou vzdálenost časový interval
6
Knoxův test založen na porovnání pravděpodobnosti p(x) pro výskyt událostí blízkých v prostoru i v čase. Pravděpodobnost p(x) se vypočte jako: má-li p(x) příliš malou hodnotu, nelze jev považovat za náhodu, musíme odmítnout nezávislost tvorby shluků v čase a prostoru x - počet párů blízkých v prostoru a zároveň v čase
7
Knoxův test pokud platí předpoklad nezávislosti prostoru a času, pak pravděpodobnost X odpovídá přibližné Poissonově distribuci kde: - intenzita výskytu S - počet událostí „blízkých v prostoru“, nastavení vhodných prostorových intervalů T - počet událostí „blízkých v čase“, nastavení vhodných časových intervalů n - počet všech událostí
8
Knoxův test Nutnost zvolit vhodné časové i prostorové intervaly v závislosti na datech. časové omezení - sledování diagnózy v období od roku , rozděleno do 6 intervalů po 4 letech od roku 1977 prostorové omezení - nejvzdálenější obce m - rozděleno taktéž na 6 stejných intervalů
9
K-funkce prostorová K funkce - očekávaný počet uspořádaných párů událostí ve vzdálenosti do h časová K funkce - očekávaný počet uspořádaných párů událostí v časovém intervalu t prostoro-časová K funkce - očekávaný počet událostí ve vzdálenosti h a časovém intervalu t libovolné události, nyní standardizovanou za jednotku plochy a jednotku času
10
K-funkce K’(h) - výpočet K-funkce
R - plocha oblasti, ve které se vyskytují pozorované události n - počet událostí v oblasti R Ih(dij) - ukazatel funkce, která je: 1 když dij =< h(zvolený interval) 0 jinak dij - vzdálenost mezi i-tými a j-tými událostmi Obdobný výpočet pro K(t) a K(h,t).
11
K-funkce Diference: K’(h,t) - K funkce pro prostor i čas KS‘(h) - K funkce pro prostor KT‘(t) - K funkce pro čas Jestliže jsou v datech nějaké prostoro-časové interakce, projeví se to zvýšením hodnot D‘(h,t).
12
Vyhodnocení dostupných nástrojů
nalezení programových prostředků pro výpočet testů vhodných pro prostoro-časové shlukování: Info-Map Cluster 3.1 (volně dostupný) Stat! S-Plus Vertical Mapper naprogramování postupu pro výpočet těchto testů (Knoxův test a K funkce) v Avenue
13
Geostatistický modul je nyní v konečném testovacím procesu
programový produkt firmy ESRI jedna z možných extenzí do programových produktů jako je ArcInfo 8.1, ArcView 8.1 a ArcEditor 8.1 pracuje na platformě Windows NT 4.0 a Windows 2000 Geostatistical Analyst dokáže používat i složité matematické metody, jako např. krigování využití nejen prostorových statistik, bodových lokalizací, ale používá se i v geologii, zemědělství, hydrologii, ekologii, atd. je nyní v konečném testovacím procesu
14
Datové zdroje Data z NOR (Národní onkologický registr), region severní Moravy Ročenka ústavu pro zdravotnické informace (ÚZIS) Datová sada ArcČR 500
15
Data Obsah: oblast severní Moravy 10 okresů, 675 obcí
celkem 5484 onkologických událostí (není známo o jakou nemoc se konkrétně jedná)
16
Data z NOR Struktura dat z NOR: Kód obce Rok narození Rok diagnózy
Počet výskytů (5484) invariantní skupina obcí (S) - doplněno ing. Vladimírem Maršíkem
17
Datová sada ArcČR 500 Tato sada dat zahrnuje celou oblast severní Moravy, její hranice a veškeré obce vyskytující se na tomto území - název obce PSČ kód okresu (př. 3807) kód obce (př ) spojený kód okresu s kódem obce (př ) základní územní jednotka invariantní skupina obcí (S)- doplněno ing. Maršíkem
18
Data ze sčítání lidu, domů a bytů (SLDB91)
z roku 1991, za území severní Moravy počty obyvatel v jednotlivých obcích rozdělených na mužskou a ženskou populaci v intervalu po 5 letech, což tvořilo celkem 16 skupin (pro muže a ženy zvlášť)
19
Počet výskytu událostí v jednotlivých okresech severní Moravy v časovém období 1977-1999
Nejčetnější výskyt v okrese: Ostrava, Karviná Nejnižší výskyt v okrese: Jeseník
20
Počet výskytu událostí na území severní Moravy ve zvolených časových intervalech sledování diagnózy
Lineární nárůst počtu událostí, postupně se přírůstek zmenšuje
21
Počet výskytu události na území severní Moravy v jednotlivých věkových kategoriích za časové období
22
Invariantní skupiny obcí - S
Změny v administrativním členění státu v průběhu času byly vykompenzovány vytvořením “časově invariantních skupin obcí”. Pro každou takovou skupinu platí, že jako celek se již v průběhu času nemění. Při sestavování skupin byla brána v potaz historie obcí, respektive základních sídelních jednotek, které je tvoří veškeré výpočty provedeny na základě této hodnoty
23
Programové aplikace výpočet reprezentativních bodů invariantních skupin obcí výpočet SIR výpočet Knoxova testu výpočet K funkce
24
Výpočet reprezentativních bodů invariantních skupin obcí
Pro skupiny obcí se stejným kódem S, tedy v čase invariantních skupin obcí, byl vypočten reprezentativní bod Odvozen z hodnot x-ových a y-ových souřadnic nejvzdálenějších obcí (xmax,ymax, xmin,ymin) jako jejich aritmetický průměr Reprezentační bod
25
Nepřímo standardizovaná incidence (SIR)
použití v epidemiologii veličina, eliminující rozdíly ve věkovém složení obyvatel sledovaného území vyjádřením poměru skutečného a očekávaného počtu onemocnění ve studované populaci SIR=1 charakterizuje průměrný výskyt nádorových onemocnění SIR < charakterizuje hodnoty nízkého výskytu onemocnění SIR>1 charakterizuje nadprůměrnou incidenci
26
Nepřímo standardizovaná incidence (SIR)
ri - skutečný počet událostí ve věkové kategorii a za každou obec ei - očekávaný počet událostí ve věkové kategorii a za každou
27
Nepřímo standardizovaná incidence (SIR)
ei – očekávaný počet událostí ai – standardní relativní incidence za celé území severní Moravy a rozdělena do věkových kategorií ni – počet žen za každou obec a zároveň rozdělených do věkových kategorií A- počet věkových kategorií
28
Nepřímo standardizovaná incidence (SIR)
ai- standardní relativní incidence – veličina pro celé sledované území ri - počet skutečných případů za celé území severní Moravy, rozdělených do věkových kategorií ni -počet člověkoroků – počet žen za celé území severní Moravy, rozdělených do věkových kategorií po 5 letech
29
Nepřímo standardizovaná incidence (SIR)
Standardní relativní incidence kód obce Invariantní skupina obcí Nepřímá standardizace výsledná hodnota Počet událostí v obci Očekávaný počet událostí
30
Nepřímo standardizovaná incidence (SIR)-vyhodnocení
SIR > Slezské Rudoltice (okres Bruntál), SIR = 4,2297. SIR > Leskovec nad Moravicí, Heřmanovcie a Roudno (okres Bruntál) Čelechovice (okres Ostrava) SIR > Bílčice, Moravský Beroun, Krasov, Malá Morávka, Karlovice (okres Bruntál) Jindřichov (okres Šumperk) Suchdol nad Odrou (okres Nový Jíčín) Slatinice (okres Olomouc) Stonava (okres Karviná) Rakov (okres Ostrava)
31
Thiessenovy polygony
34
Použití metody jádrového vyhlazování
35
Vyhodnocení Knoxova testu
problémem při výpočtu Knoxova testu pro celé území bylo množství dat pomocná tabulka obsahovala celkem možných číselných kombinací celkový výpočet Knoxova testu by na těchto datech trval několik dnů, proto byl výpočet aplikován jen vybraný okres Bruntál, jelikož se ukázal ve výsledcích nepřímo standardizované incidence jako oblast s vysokým výskytem onkologického onemocnění
36
Výsledná tabulka výpočtu Knoxova testu za okres Bruntál
Počet událostí vyhovující danému intervalu (kroku) - omezení časem i prostorem Počet událostí vyhovující danému intervalu - omezení prostorovým intervalem Počet událostí vyhovující danému intervalu - omezení časovým intervalem Zvolený interval pro čas Zvolený interval pro prostor Nejnižší hodnota pravděpodobnosti Nejvyšší hodnota pravděpodobnosti Výsledná tabulka výpočtu Knoxova testu za okres Bruntál
37
3D graf znázorňující výsledky Knoxova testu za okres Bruntál
38
Vyhodnocení K-funkce metoda výpočtu nebyla nejspíš příliš vhodně zvolena v závislosti na datech výsledky, které byly získány výpočtem nebyly nijak srozumitelné, nedalo se z nich vyčíst, zda dochází ke shlukování onkologických případů či nikoliv především u výpočtu diference vycházely řádově velice velké hodnoty s největší pravděpodobností by se tato metoda dala použít pro jiný typ dat
39
Ukázka výpočtu K funkce pro okres Bruntál
Počet událostí vyhovující danému intervalu Zvolený interval pro čas K funkce pro čas diference K funkce pro čas i prostor Zvolený interval pro prostor K funkce pro prostor Ukázka výpočtu K funkce pro okres Bruntál
40
Programové prostředky
ArcView 3.1 Avenue (programovací jazyk) Microsoft Excel
41
Literatura [1] Bailey T. C., Gatrell A. C.: Interactive spatial data analysis; Longman Scientific & Technical, 1995 [2] Elliot P., Cuznik J., Englist D., Stem R.: Geographical & Environmental Epidemiology [3] Maršík V. a kol.: Atlas výskytu zhoubných nádoru v České republice, Masarykův onkologický ústav v Brně, 1998 [4] Horák J.:Úvod do prostorové analýzy, učební texty, Ostrava 1998 [5] Mantel, N.: The detection of disease clustering and a generalised regression approach, Cancer Research, 1967
42
Děkuji za pozornost
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.