Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562.

Podobné prezentace


Prezentace na téma: "Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562."— Transkript prezentace:

1 Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing. Pavel Hrbáček

2 Zadání provést souhrn a porovnání již existujících testovacích metod
vyhodnotit dostupné nástroje (geostatistický modul v systému ArcInfo, dostupná řešení v ArcView a MapInfo) vyhodnocování prostoro-časového shlukování na obdržených datech (data o výskytu statisticky málo četných onemocnění)

3 Postup 1. Samostatné nastudování problematiky
2. Nalezení vhodných programových prostředků pro výpočet prostoro-časového shlukování 3. Provedení samotné implementace, zobrazení a vyhodnocení výsledků

4 Prostoro-časové shlukování
cílem je posoudit, zda dochází u pozorovaných událostí současně ke shlukování v čase a v prostoru, zda platí korelace mezi vzdáleností v prostoru a časovým rozdílem v čase konání jednotlivé událostí sledování, vzájemného působení prostoru a času pro studium dynamických procesů (např. epidemiologické události apod.)

5 Knoxův test Definice: z n událostí je možno získat n(n-1) uspořádaných dvojic pro každý z těchto párů můžeme měřit: prostorovou vzdálenost časový interval

6 Knoxův test založen na porovnání pravděpodobnosti p(x) pro výskyt událostí blízkých v prostoru i v čase. Pravděpodobnost p(x) se vypočte jako: má-li p(x) příliš malou hodnotu, nelze jev považovat za náhodu, musíme odmítnout nezávislost tvorby shluků v čase a prostoru x - počet párů blízkých v prostoru a zároveň v čase

7 Knoxův test pokud platí předpoklad nezávislosti prostoru a času, pak pravděpodobnost X odpovídá přibližné Poissonově distribuci kde:  - intenzita výskytu S - počet událostí „blízkých v prostoru“, nastavení vhodných prostorových intervalů T - počet událostí „blízkých v čase“, nastavení vhodných časových intervalů n - počet všech událostí

8 Knoxův test Nutnost zvolit vhodné časové i prostorové intervaly v závislosti na datech. časové omezení - sledování diagnózy v období od roku , rozděleno do 6 intervalů po 4 letech od roku 1977 prostorové omezení - nejvzdálenější obce m - rozděleno taktéž na 6 stejných intervalů

9 K-funkce prostorová K funkce - očekávaný počet uspořádaných párů událostí ve vzdálenosti do h časová K funkce - očekávaný počet uspořádaných párů událostí v časovém intervalu t prostoro-časová K funkce - očekávaný počet událostí ve vzdálenosti h a časovém intervalu t libovolné události, nyní standardizovanou za jednotku plochy a jednotku času

10 K-funkce K’(h) - výpočet K-funkce
R - plocha oblasti, ve které se vyskytují pozorované události n - počet událostí v oblasti R Ih(dij) - ukazatel funkce, která je: 1 když dij =< h(zvolený interval) 0 jinak dij - vzdálenost mezi i-tými a j-tými událostmi Obdobný výpočet pro K(t) a K(h,t).

11 K-funkce Diference: K’(h,t) - K funkce pro prostor i čas KS‘(h) - K funkce pro prostor KT‘(t) - K funkce pro čas Jestliže jsou v datech nějaké prostoro-časové interakce, projeví se to zvýšením hodnot D‘(h,t).

12 Vyhodnocení dostupných nástrojů
nalezení programových prostředků pro výpočet testů vhodných pro prostoro-časové shlukování: Info-Map Cluster 3.1 (volně dostupný) Stat! S-Plus Vertical Mapper naprogramování postupu pro výpočet těchto testů (Knoxův test a K funkce) v Avenue

13 Geostatistický modul je nyní v konečném testovacím procesu
programový produkt firmy ESRI jedna z možných extenzí do programových produktů jako je ArcInfo 8.1, ArcView 8.1 a ArcEditor 8.1 pracuje na platformě Windows NT 4.0 a Windows 2000 Geostatistical Analyst dokáže používat i složité matematické metody, jako např. krigování využití nejen prostorových statistik, bodových lokalizací, ale používá se i v geologii, zemědělství, hydrologii, ekologii, atd. je nyní v konečném testovacím procesu

14 Datové zdroje Data z NOR (Národní onkologický registr), region severní Moravy Ročenka ústavu pro zdravotnické informace (ÚZIS) Datová sada ArcČR 500

15 Data Obsah: oblast severní Moravy 10 okresů, 675 obcí
celkem 5484 onkologických událostí (není známo o jakou nemoc se konkrétně jedná)

16 Data z NOR Struktura dat z NOR: Kód obce Rok narození Rok diagnózy
Počet výskytů (5484) invariantní skupina obcí (S) - doplněno ing. Vladimírem Maršíkem

17 Datová sada ArcČR 500 Tato sada dat zahrnuje celou oblast severní Moravy, její hranice a veškeré obce vyskytující se na tomto území - název obce PSČ kód okresu (př. 3807) kód obce (př ) spojený kód okresu s kódem obce (př ) základní územní jednotka invariantní skupina obcí (S)- doplněno ing. Maršíkem

18 Data ze sčítání lidu, domů a bytů (SLDB91)
z roku 1991, za území severní Moravy počty obyvatel v jednotlivých obcích rozdělených na mužskou a ženskou populaci v intervalu po 5 letech, což tvořilo celkem 16 skupin (pro muže a ženy zvlášť)

19 Počet výskytu událostí v jednotlivých okresech severní Moravy v časovém období 1977-1999
Nejčetnější výskyt v okrese: Ostrava, Karviná Nejnižší výskyt v okrese: Jeseník

20 Počet výskytu událostí na území severní Moravy ve zvolených časových intervalech sledování diagnózy
Lineární nárůst počtu událostí, postupně se přírůstek zmenšuje

21 Počet výskytu události na území severní Moravy v jednotlivých věkových kategoriích za časové období

22 Invariantní skupiny obcí - S
Změny v administrativním členění státu v průběhu času byly vykompenzovány vytvořením “časově invariantních skupin obcí”. Pro každou takovou skupinu platí, že jako celek se již v průběhu času nemění. Při sestavování skupin byla brána v potaz historie obcí, respektive základních sídelních jednotek, které je tvoří veškeré výpočty provedeny na základě této hodnoty

23 Programové aplikace výpočet reprezentativních bodů invariantních skupin obcí výpočet SIR výpočet Knoxova testu výpočet K funkce

24 Výpočet reprezentativních bodů invariantních skupin obcí
Pro skupiny obcí se stejným kódem S, tedy v čase invariantních skupin obcí, byl vypočten reprezentativní bod Odvozen z hodnot x-ových a y-ových souřadnic nejvzdálenějších obcí (xmax,ymax, xmin,ymin) jako jejich aritmetický průměr Reprezentační bod

25 Nepřímo standardizovaná incidence (SIR)
použití v epidemiologii veličina, eliminující rozdíly ve věkovém složení obyvatel sledovaného území vyjádřením poměru skutečného a očekávaného počtu onemocnění ve studované populaci SIR=1 charakterizuje průměrný výskyt nádorových onemocnění SIR < charakterizuje hodnoty nízkého výskytu onemocnění SIR>1 charakterizuje nadprůměrnou incidenci

26 Nepřímo standardizovaná incidence (SIR)
ri - skutečný počet událostí ve věkové kategorii a za každou obec ei - očekávaný počet událostí ve věkové kategorii a za každou

27 Nepřímo standardizovaná incidence (SIR)
ei – očekávaný počet událostí ai – standardní relativní incidence za celé území severní Moravy a rozdělena do věkových kategorií ni – počet žen za každou obec a zároveň rozdělených do věkových kategorií A- počet věkových kategorií

28 Nepřímo standardizovaná incidence (SIR)
ai- standardní relativní incidence – veličina pro celé sledované území ri - počet skutečných případů za celé území severní Moravy, rozdělených do věkových kategorií ni -počet člověkoroků – počet žen za celé území severní Moravy, rozdělených do věkových kategorií po 5 letech

29 Nepřímo standardizovaná incidence (SIR)
Standardní relativní incidence kód obce Invariantní skupina obcí Nepřímá standardizace výsledná hodnota Počet událostí v obci Očekávaný počet událostí

30 Nepřímo standardizovaná incidence (SIR)-vyhodnocení
SIR > Slezské Rudoltice  (okres Bruntál), SIR = 4,2297. SIR > Leskovec nad Moravicí, Heřmanovcie a Roudno (okres Bruntál) Čelechovice (okres Ostrava) SIR > Bílčice, Moravský Beroun, Krasov, Malá Morávka, Karlovice (okres Bruntál) Jindřichov (okres Šumperk) Suchdol nad Odrou (okres Nový Jíčín) Slatinice (okres Olomouc) Stonava (okres Karviná) Rakov (okres Ostrava)

31 Thiessenovy polygony

32

33

34 Použití metody jádrového vyhlazování

35 Vyhodnocení Knoxova testu
problémem při výpočtu Knoxova testu pro celé území bylo množství dat pomocná tabulka obsahovala celkem možných číselných kombinací celkový výpočet Knoxova testu by na těchto datech trval několik dnů, proto byl výpočet aplikován jen vybraný okres Bruntál, jelikož se ukázal  ve výsledcích nepřímo standardizované incidence jako oblast s vysokým výskytem onkologického onemocnění

36 Výsledná tabulka výpočtu Knoxova testu za okres Bruntál
Počet událostí vyhovující danému intervalu (kroku) - omezení časem i prostorem Počet událostí vyhovující danému intervalu - omezení prostorovým intervalem Počet událostí vyhovující danému intervalu - omezení časovým intervalem Zvolený interval pro čas Zvolený interval pro prostor Nejnižší hodnota pravděpodobnosti Nejvyšší hodnota pravděpodobnosti Výsledná tabulka výpočtu Knoxova testu za okres Bruntál

37 3D graf znázorňující výsledky Knoxova testu za okres Bruntál

38 Vyhodnocení K-funkce metoda výpočtu nebyla nejspíš příliš vhodně zvolena v závislosti na datech výsledky, které byly získány výpočtem nebyly nijak srozumitelné, nedalo se z nich vyčíst, zda dochází ke shlukování onkologických případů či nikoliv především u výpočtu diference vycházely řádově velice velké hodnoty s největší pravděpodobností by se tato metoda dala použít pro jiný typ dat

39 Ukázka výpočtu K funkce pro okres Bruntál
Počet událostí vyhovující danému intervalu Zvolený interval pro čas K funkce pro čas diference K funkce pro čas i prostor Zvolený interval pro prostor K funkce pro prostor Ukázka výpočtu K funkce pro okres Bruntál

40 Programové prostředky
ArcView 3.1 Avenue (programovací jazyk) Microsoft Excel

41 Literatura [1] Bailey T. C., Gatrell A. C.: Interactive spatial data analysis; Longman Scientific & Technical, 1995 [2] Elliot P., Cuznik J., Englist D., Stem R.: Geographical & Environmental Epidemiology [3] Maršík V. a kol.: Atlas výskytu zhoubných nádoru v České republice, Masarykův onkologický ústav v Brně, 1998 [4] Horák J.:Úvod do prostorové analýzy, učební texty, Ostrava 1998 [5] Mantel, N.: The detection of disease clustering and a generalised regression approach, Cancer Research, 1967

42 Děkuji za pozornost


Stáhnout ppt "Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje Zpracovala: Jana Možiešiková, G 562."

Podobné prezentace


Reklamy Google