Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Zpracovala : Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing.

Podobné prezentace


Prezentace na téma: "Zpracovala : Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing."— Transkript prezentace:

1 Zpracovala : Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing. Pavel Hrbáček Zpracovala : Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing. Pavel Hrbáček Analýza prostorových dat metodou prostoro-časového shlukování a testování přítomnosti shluků kolem bodového zdroje

2 Zadání provést souhrn a porovnání již existujících testovacích metod vyhodnotit dostupné nástroje (geostatistický modul v systému ArcInfo, dostupná řešení v ArcView a MapInfo) vyhodnocování prostoro-časového shlukování na obdržených datech (data o výskytu statisticky málo četných onemocnění)

3 Postup 1. Samostatné nastudování problematiky 2. Nalezení vhodných programových prostředků pro výpočet prostoro-časového shlukování 3. Provedení samotné implementace, zobrazení a vyhodnocení výsledků

4 Prostoro-časové shlukování cílem je posoudit, zda dochází u pozorovaných událostí současně ke shlukování v čase a v prostoru, zda platí korelace mezi vzdáleností v prostoru a časovým rozdílem v čase konání jednotlivé událostí sledování, vzájemného působení prostoru a času pro studium dynamických procesů (např. epidemiologické události apod.)

5 Knoxův test Definice: z n událostí je možno získat n(n-1) uspořádaných dvojic pro každý z těchto párů můžeme měřit: –prostorovou vzdálenost –časový interval

6 Knoxův test založen na porovnání pravděpodobnosti p(x) pro výskyt událostí blízkých v prostoru i v čase. Pravděpodobnost p(x) se vypočte jako: má-li p(x) příliš malou hodnotu, nelze jev považovat za náhodu, musíme odmítnout nezávislost tvorby shluků v čase a prostoru x - počet párů blízkých v prostoru a zároveň v čase

7 Knoxův test pokud platí předpoklad nezávislosti prostoru a času, pak pravděpodobnost X odpovídá přibližné Poissonově distribuci kde: - intenzita výskytu S - počet událostí „blízkých v prostoru“, nastavení vhodných prostorových intervalů T - počet událostí „blízkých v čase“, nastavení vhodných časových intervalů n - počet všech událostí

8 Knoxův test Nutnost zvolit vhodné časové i prostorové intervaly v závislosti na datech. časové omezení - sledování diagnózy v období od roku , rozděleno do 6 intervalů po 4 letech od roku 1977 prostorové omezení - nejvzdálenější obce m - rozděleno taktéž na 6 stejných intervalů

9 K-funkce prostorová K funkce - očekávaný počet uspořádaných párů událostí ve vzdálenosti do h časová K funkce - očekávaný počet uspořádaných párů událostí v časovém intervalu t prostoro-časová K funkce - očekávaný počet událostí ve vzdálenosti h a časovém intervalu t libovolné události, nyní standardizovanou za jednotku plochy a jednotku času

10 K-funkce K’(h) - výpočet K-funkce R - plocha oblasti, ve které se vyskytují pozorované události n - počet událostí v oblasti R I h (d ij ) - ukazatel funkce, která je: 1 když d ij =< h(zvolený interval) 0 jinak 0 jinak d ij - vzdálenost mezi i-tými a j-tými událostmi Obdobný výpočet pro K(t) a K(h,t).

11 K-funkce Diference: K’(h,t) - K funkce pro prostor i čas K S ‘(h) - K funkce pro prostor K T ‘(t) - K funkce pro čas Jestliže jsou v datech nějaké prostoro-časové interakce, projeví se to zvýšením hodnot D‘(h,t).

12 Vyhodnocení dostupných nástrojů nalezení programových prostředků pro výpočet testů vhodných pro prostoro-časové shlukování: –Info-Map –Cluster 3.1 (volně dostupný) –Stat! –S-Plus –Vertical Mapper naprogramování postupu pro výpočet těchto testů (Knoxův test a K funkce) v Avenue

13 Geostatistický modul programový produkt firmy ESRI jedna z možných extenzí do programových produktů jako je ArcInfo 8.1, ArcView 8.1 a ArcEditor 8.1 pracuje na platformě Windows NT 4.0 a Windows 2000 Geostatistical Analyst dokáže používat i složité matematické metody, jako např. krigování využití nejen prostorových statistik, bodových lokalizací, ale používá se i v geologii, zemědělství, hydrologii, ekologii, atd. je nyní v konečném testovacím procesu

14 Datové zdroje Data z NOR (Národní onkologický registr), region severní Moravy Ročenka ústavu pro zdravotnické informace (ÚZIS) Datová sada ArcČR 500

15 Data Obsah: oblast severní Moravy 10 okresů, 675 obcí celkem 5484 onkologických událostí (není známo o jakou nemoc se konkrétně jedná)

16 Data z NOR Struktura dat z NOR: –Kód obce –Rok narození –Rok diagnózy –Počet výskytů (5484) –invariantní skupina obcí ( S ) - doplněno ing. Vladimírem Maršíkem

17 Datová sada ArcČR 500 Tato sada dat zahrnuje celou oblast severní Moravy, její hranice a veškeré obce vyskytující se na tomto území - název obce - PSČ - kód okresu (př. 3807) - kód obce (př ) - spojený kód okresu s kódem obce (př ) - základní územní jednotka - invariantní skupina obcí (S)- doplněno ing. Maršíkem

18 Data ze sčítání lidu, domů a bytů (SLDB91) z roku 1991, za území severní Moravy počty obyvatel v jednotlivých obcích rozdělených na mužskou a ženskou populaci v intervalu po 5 letech, což tvořilo celkem 16 skupin (pro muže a ženy zvlášť)

19 Počet výskytu událostí v jednotlivých okresech severní Moravy v časovém období Nejčetnější výskyt v okrese: Ostrava, Karviná Nejnižší výskyt v okrese: Jeseník

20 Počet výskytu událostí na území severní Moravy ve zvolených časových intervalech sledování diagnózy Lineární nárůst počtu událostí, postupně se přírůstek zmenšuje

21 Počet výskytu události na území severní Moravy v jednotlivých věkových kategoriích za časové období

22 Invariantní skupiny obcí - S Změny v administrativním členění státu v průběhu času byly vykompenzovány vytvořením “časově invariantních skupin obcí”. Pro každou takovou skupinu platí, že jako celek se již v průběhu času nemění. Při sestavování skupin byla brána v potaz historie obcí, respektive základních sídelních jednotek, které je tvoří veškeré výpočty provedeny na základě této hodnoty

23 Programové aplikace výpočet reprezentativních bodů invariantních skupin obcí výpočet SIR výpočet Knoxova testu výpočet K funkce

24 Výpočet reprezentativních bodů invariantních skupin obcí Pro skupiny obcí se stejným kódem S, tedy v čase invariantních skupin obcí, byl vypočten reprezentativní bod Odvozen z hodnot x-ových a y-ových souřadnic nejvzdálenějších obcí (x max,y max, x min,y min ) jako jejich aritmetický průměr Reprezentační bod

25 Nepřímo standardizovaná incidence (SIR) použití v epidemiologii veličina, eliminující rozdíly ve věkovém složení obyvatel sledovaného území vyjádřením poměru skutečného a očekávaného počtu onemocnění ve studované populaci SIR=1 charakterizuje průměrný výskyt nádorových onemocnění SIR < 1 charakterizuje hodnoty nízkého výskytu onemocnění SIR>1 charakterizuje nadprůměrnou incidenci

26 Nepřímo standardizovaná incidence (SIR) r i - skutečný počet událostí ve věkové kategorii a za každou obec e i - očekávaný počet událostí ve věkové kategorii a za každou obec

27 Nepřímo standardizovaná incidence (SIR) e i – očekávaný počet událostí a i – standardní relativní incidence za celé území severní Moravy a rozdělena do věkových kategorií n i – počet žen za každou obec a zároveň rozdělených do věkových kategorií A- počet věkových kategorií

28 Nepřímo standardizovaná incidence (SIR) a i - standardní relativní incidence – veličina pro celé sledované území r i - počet skutečných případů za celé území severní Moravy, rozdělených do věkových kategorií n i -počet člověkoroků – počet žen za celé území severní Moravy, rozdělených do věkových kategorií po 5 letech

29 Nepřímo standardizovaná incidence (SIR) Invariantní skupina obcí kód obce Počet událostí v obci Standardní relativní incidence Nepřímá standardizace výsledná hodnota Očekávaný počet událostí

30 Nepřímo standardizovaná incidence (SIR)-vyhodnocení SIR > 4 - Slezské Rudoltice (okres Bruntál), SIR = 4,2297. SIR > 3 - Leskovec nad Moravicí, Heřmanovcie a Roudno (okres Bruntál) Čelechovice (okres Ostrava) SIR > 2 - Bílčice, Moravský Beroun, Krasov, Malá Morávka, Karlovice (okres Bruntál) Jindřichov (okres Šumperk) Suchdol nad Odrou (okres Nový Jíčín) Slatinice (okres Olomouc) Stonava (okres Karviná) Rakov (okres Ostrava)

31 Thiessenovy polygony

32

33

34 Použití metody jádrového vyhlazování

35 Vyhodnocení Knoxova testu problémem při výpočtu Knoxova testu pro celé území bylo množství dat pomocná tabulka obsahovala celkem možných číselných kombinací celkový výpočet Knoxova testu by na těchto datech trval několik dnů, proto byl výpočet aplikován jen vybraný okres Bruntál, jelikož se ukázal ve výsledcích nepřímo standardizované incidence jako oblast s vysokým výskytem onkologického onemocnění

36 Zvolený interval pro čas Zvolený interval pro prostor Počet událostí vyhovující danému intervalu - omezení časovým intervalem Počet událostí vyhovující danému intervalu - omezení prostorovým intervalem Počet událostí vyhovující danému intervalu (kroku) - omezení časem i prostorem Výsledná tabulka výpočtu Knoxova testu za okres Bruntál Nejnižší hodnota pravděpodobnosti Nejvyšší hodnota pravděpodobnosti

37 3D graf znázorňující výsledky Knoxova testu za okres Bruntál

38 Vyhodnocení K-funkce metoda výpočtu nebyla nejspíš příliš vhodně zvolena v závislosti na datech výsledky, které byly získány výpočtem nebyly nijak srozumitelné, nedalo se z nich vyčíst, zda dochází ke shlukování onkologických případů či nikoliv především u výpočtu diference vycházely řádově velice velké hodnoty s největší pravděpodobností by se tato metoda dala použít pro jiný typ dat

39 Zvolený interval pro čas Zvolený interval pro prostor Počet událostí vyhovující danému intervalu K funkce pro čas i prostor K funkce pro čas K funkce pro prostor diference Ukázka výpočtu K funkce pro okres Bruntál

40 Programové prostředky ArcView 3.1 Avenue (programovací jazyk) Microsoft Excel

41 Literatura [1] Bailey T. C., Gatrell A. C.: Interactive spatial data analysis; Longman Scientific & Technical, 1995 [2] Elliot P., Cuznik J., Englist D., Stem R.: Geographical & Environmental Epidemiology [3] Maršík V. a kol.: Atlas výskytu zhoubných nádoru v České republice, Masarykův onkologický ústav v Brně, 1998 [4] Horák J.:Úvod do prostorové analýzy, učební texty, Ostrava 1998 [5] Mantel, N.: The detection of disease clustering and a generalised regression approach, Cancer Research, 1967

42 Děkuji za pozornost


Stáhnout ppt "Zpracovala : Jana Možiešiková, G 562 VŠB-TU Ostrava, fakulta HGF, obor GIS Vedoucí projektu : Dr. Ing. Jiří Horák Konzultant : Ing. Vladimír Maršík, Ing."

Podobné prezentace


Reklamy Google