Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Text mining – definice inteligentní analýza textu textový data mining
proces extrakce skrytých informací z nestrukturovaného textu používá kombinaci strojového učení, statistické analýzy..
2
Je to k něčemu? asi jo, jelikož 80% informací je textových
ECHELON = sledování komunikačních kanálů (automatická analýza velkého množství dat..)
3
Rozdíl od hledání na webu
Na webu většinou hledáme napsané a známé věci X V text miningu hledáme neznámou informaci
4
Similarita s data miningem
Problém umístění másla v text miningu – vzory jsou extrahovány z normálního jazyka, ne ze strukturovaných databází Pro text mining jsou nejvhodnější NESTRUKTUROVANÉ dokumenty
5
Computational linguistic
= LANGUAGE PROCESSING Extrahování frází -> sumarizace (nejčastější slova bez balastních členů) !Není text mining!
6
Konkrétní příklad 1 Jména lidí a společností zab. se bezdrátovou technologií Pokus odvodit vztahy mezi firmami, kdo je hlavní atp.. Problém zhodnocení vztahů – je jich hodně ..
7
Příklad 2 - interakce genů
Články zabývajícícmi se geny Nehledáme přímé páry názvy genů + ostatní slova V dalších článcích hledáme právě ostatní slova Překvapivě dobré výsledky
9
Shrnutí Text Mining = objevení dosud nepublikované informace z velkého množství textu hledání na webu Existuje něco jako Computational Linguistics Text mining neřeší celý problém, ale může pomoci se dobrat výsledku
10
Literatura a zdroje 1 http://www.klariti.com/text-mining/index.shtml
11
Literatura a zdroje 2
12
kaja.maly zavinac seznam.cz
KONEC Autor: Karel Malý kaja.maly zavinac seznam.cz
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.