Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Text mining – definice inteligentní analýza textu textový data mining proces extrakce skrytých informací z nestrukturovaného textu používá kombinaci strojového.

Podobné prezentace


Prezentace na téma: "Text mining – definice inteligentní analýza textu textový data mining proces extrakce skrytých informací z nestrukturovaného textu používá kombinaci strojového."— Transkript prezentace:

1 Text mining – definice inteligentní analýza textu textový data mining proces extrakce skrytých informací z nestrukturovaného textu používá kombinaci strojového učení, statistické analýzy..

2 Je to k něčemu? asi jo, jelikož 80% informací je textových ECHELON = sledování komunikačních kanálů (automatická analýza velkého množství dat..)

3 Rozdíl od hledání na webu Na webu většinou hledáme napsané a známé věci X V text miningu hledáme neznámou informaci

4 Similarita s data miningem Problém umístění másla v text miningu – vzory jsou extrahovány z normálního jazyka, ne ze strukturovaných databází Pro text mining jsou nejvhodnější NESTRUKTUROVANÉ dokumenty

5 Computational linguistic = LANGUAGE PROCESSING Extrahování frází -> sumarizace (nejčastější slova bez balastních členů) !Není text mining!

6 Konkrétní příklad 1 Jména lidí a společností zab. se bezdrátovou technologií  Pokus odvodit vztahy mezi firmami, kdo je hlavní atp..  Problém zhodnocení vztahů – je jich hodně..

7 Příklad 2 - interakce genů Články zabývajícícmi se geny Nehledáme přímé páry názvy genů + ostatní slova V dalších článcích hledáme právě ostatní slova  Překvapivě dobré výsledky

8

9 Shrnutí Text Mining = objevení dosud nepublikované informace z velkého množství textu  hledání na webu Existuje něco jako Computational Linguistics Text mining neřeší celý problém, ale může pomoci se dobrat výsledku

10 Literatura a zdroje1 mining/index.shtml mining/index.shtml m/hearst/ m/hearst/ rses/is296a- 4/f99/Lectures/acl99.ppt rses/is296a- 4/f99/Lectures/acl99.ppt

11 Literatura a zdroje 2 er/paper_sub.cfm?whitepaperId= er/paper_sub.cfm?whitepaperId= rst/text-mining.html rst/text-mining.html textmining/ textmining/

12 KONEC Autor: Karel Malý kaja.maly zavinac seznam.cz


Stáhnout ppt "Text mining – definice inteligentní analýza textu textový data mining proces extrakce skrytých informací z nestrukturovaného textu používá kombinaci strojového."

Podobné prezentace


Reklamy Google