Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Využití ontologií při dobývání znalostí z databází Hana Češpivová.

Podobné prezentace


Prezentace na téma: "Využití ontologií při dobývání znalostí z databází Hana Češpivová."— Transkript prezentace:

1 Využití ontologií při dobývání znalostí z databází Hana Češpivová

2 Ontologie „Stulong_UMLS“ založená na lékařské ontologii UMLS Ontologie „Stulong_UMLS“ založená na lékařské ontologii UMLS Data projektu STULONG Data projektu STULONG 4ft-Miner 4ft-Miner

3 Ontologie „Stulong_UMLS Zpět …

4 Využití ontologie v rámci metodologie CRISP-DM 1. Porozumění problematice – ontologie by nám měla umožnit celistvý pohled na analyzovanou oblast a pomoci uvědomit si všechny vztahy mezi objekty v této oblasti. 2. Porozumění datům – ontologie nám může poskytnout jiný úhel pohledu na data a to hlavně z hlediska jejich roztřídění do skupin, hierarchie těchto skupin a vztahů mezi nimi. 3. Příprava dat – v této fázi by mělo proběhnout mapování získaných dat na ontologii dané oblasti. Poté může následovat tvorba dílčích cedentů, pokud je analýza dat prováděna pomocí systému LISp-Miner. 4. Modelování – v této fázi zatím nevidím využití ontologie. Je zatím otázkou, zda by bylo možné ontologii využívat třeba pro tvorbu dílčích úloh či jejich zpřesňování. 5. Vyhodnocení výsledků – v tuto chvíli můžeme ontologii využít k posouzení, zda byly potvrzeny známé vztahy, nalezeny výjimky či nové znalosti. 6. Využití výsledků – získané výsledky mohou být mimo jiné využity i k doplnění či opravě existující ontologie.

5 Formulace analytické úlohy Fáze porozumění datům a příprava dat v rámci metodologie CRISP-DM 1. Jednoduché úlohy - úlohy jsou odvozeny z přímých vztahů mezi třídami. 2. Úlohy „přes uzel“ - úlohy by měly hledat souvislosti mezi třídami ob jednu či více tříd. 3. Úlohy s více dílčími cedenty v antecedentu (podle vztahu dvou či více tříd k jedné třídě) - úlohy by měly hledat vztahy více tříd k jedné třídě tak, aby vztahy tříd v antecedentu byli vůči třídě v sukcedentu shodné. 4. Úlohy s více dílčími cedenty v antecedentu (po směru několika šipek - vztahů) - úlohy by měly hledat vztahy více tříd k jedné třídě prostřednictvím řetězení různých vztahů. graf

6 Mapování dat na ontologii a tvorba dílčích cedentů Fáze přípravy dat v rámci metodologie CRISP-DM Mapování atributů (dat) by měl provádět člověk, který rozumí oblasti zkoumání. Jednotlivé dílčí cedenty by měly být tvořeny vrcholovými třídami ontologie. graf

7 Zpracování dílčích úloh pomocí 4ft-Mineru Fáze modelování v rámci metodologie CRISP-DM Spíše činnost člověka, který ovládá 4ft-Miner. Je zatím otázkou, zda by bylo možné využívat ontologii třeba pro tvorbu dílčích úloh či jejich zpřesňování.

8 Interpretace výsledků analýzy analytické úlohy Fáze vyhodnocení výsledků v rámci metodologie CRISP-DM Posouzení, zda jde o potvrzení pravidla, nalezení výjimky či nové znalosti. Potvrzení pravidla – nalezení vztahu tam, kde je očekáván. Potvrzení pravidla – nalezení vztahu tam, kde je očekáván. Nalezení výjimky – nalezení vztahu tam, kde by neměl být nebo naopak nenalezení žádného vztahu tam, kde je očekáván. Nalezení výjimky – nalezení vztahu tam, kde by neměl být nebo naopak nenalezení žádného vztahu tam, kde je očekáván. Nalezení nových znalostí – nalezení nového vztahu. Nalezení nových znalostí – nalezení nového vztahu.

9 Problémy Má smysl vytvářet ontologii pro analyzovaná data? Má smysl vytvářet ontologii pro analyzovaná data? Má se využít již existující ontologie? A případně jaká? Má se využít již existující ontologie? A případně jaká?


Stáhnout ppt "Využití ontologií při dobývání znalostí z databází Hana Češpivová."

Podobné prezentace


Reklamy Google