Text mining – definice inteligentní analýza textu textový data mining

Slides:



Advertisements
Podobné prezentace
Role vzdělávání v soudobé společnosti na příkladu České republiky
Advertisements

Vyhledávací stoje na Internetu. (vyhledavače pro začátečníky)
Střední škola služeb a podnikání, Ostrava-Poruba příspěvková organizace Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:
Souborný katalog SKAT a elektronické informační zdroje z dílny firmy LANius s.r.o. Ing. Jiří Šilha.
Štěpán Šípal Gymnázium Čakovice. Dnešní témata  Vznik XHTML a předchůdci  Základní prvky XHTML dokumentu  Tagy a atributy  Elementy a jejich druhy.
STRUKTUROVANÉ KABELÁŽNÍ SYSTÉMY pro komunikační sítě část 2.
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
Základy html pro úplné začátečníky.
Jak má vypadat článek i pro zkoušku. Název (Title) stručný, výstižný Autoři Adresy Affiliation (Při více autorech bývá označen Corresponding author) Abstract:
VY_32_INOVACE_Čj-Ml 6.,7.14 Anotace: Prezentace je zaměřena na dělení podstatných jmen. Obsahuje dělení podstatných jmen na konkrétní a abstraktní a pomnožná,
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Passport PhDr. Ivana Reznerová Centrum informačních a knihovnických služeb Odbor informační podpory studia a výzkumu
Technologie pro CI. Od technologií pro CI vyžadujeme především funkce vyhledávání v rozsáhlých databázích na základě libovolných dotazů, propojování a.
DOK.
Jednoduché aplikace ve Windows Název materiálu: VY_INOVACE_xxx_aplikace_widows Číslo projektu: CZ.1.07/1.4.00/ Vzdělávací oblast: Informační a komunikační.
Informační systémy podnikové systémy CRM
Informace – vyhledávání informací
Pozorování prezentuje: Václav Bubeníček.
Ochrana aktiv v malé firmě Bakalářská práce Pavel Šnajdr – Aplikovaná informatika.
Problém - sporná, nerozřešená otázka nebo nesnadný úkol - překážka Řešení problémů.
15. ESEJE Cíl : připravit osnovu eseje a poté esej napsat
VY_32_INOVACE_Čj-Ml 6.,7.16 Anotace: Prezentace uvádí přehled a stručnou definici jednotlivých neohebných slovních druhů. Vzdělávací oblast: český jazyk.
VY_32_INOVACE_Čj-Sl 6.,7.19 Anotace: Prezentace je zaměřena na administrativní styl a útvar životopisu, vysvětluje jeho hlavní znaky a funkci. Obsahuje.
Systémy pro podporu managementu 2
Management a rozvoj obcí
Práce se soubory Soubory se používají pro ukládání dat pro pozdější použití. Dalším a lepším způsobem jak ukládat data je použití databáze. Soubory se.
PPíšeme vědecký článek. Jaký článek – domácí úkol o dvou brožurách o jaderné fyzice a zkušenostech z jejich použití (ověření použitelnosti, expertní posouzení)
Databázové systémy Přednáška č. 4 Proces návrhu databáze.
Klávesové zkratky 1 Ročník: 6 Předmět: Informační a komunikační technologie Učitel: Vojtěch Novotný Téma: Klávesové zkratky 1 Ověřeno ve výuce:
SEKCE SDRUK PRO IT Souborný katalog SKAT a elektronické informační zdroje z dílny firmy LANius s.r.o. Ing. Jiří Šilha.
Získávání znalostí z medicínských textů Petr Kolesa EuroMISE Centrum.
Georeporty aplikované využití geoprostorových informací
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Klíčové kompetence, výchovné a vzdělávací strategie Náměty a zkušenosti, jak pracovat s KK a VVS.
URL v HTML URL - Unique Resource Locator Příklad:
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
EBSCO Ramis Václavík Centrum informačních a knihovnických služeb Odbor informační podpory studia a výzkumu
Mgr. Karel FischerZáhlaví a zápatí1 Dokument ve Wordu si můžeme zobrazit ve dvou základních zobrazeních : a) Zobrazení NORMÁLNĚ b) Zobrazení ROZVRŽENÍ.
Střední škola služeb a podnikání, Ostrava-Poruba příspěvková organizace Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:
Vzor na všechno. Vzor – úvod Problém .. Příklad: widgety .. Jak na to? .. Známý také jako...
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Web of Science - Web of Science TM Core Collection Mgr. Libuše Simandlová Centrum informačních a knihovnických služeb Odbor informační podpory studia a.
Předzpracování nestrukturovaných dat pomocí jazyka Snowball , Brno Připravil: Bc. Pavel Řezníček.
KURZ ZÁKLADY PRÁCE S POČÍTAČEM 1 Vyhledávání na internetu Autor: Mgr. Aleš Kozák.
Umělá inteligence Robin Horniak. Definice Umělá inteligence (Artificial Intelligence), zkráceně UI (AI) věda, která se zabývá tím, jak přinutit stroje.
WEBOVÝ PORTÁL O POČÍTAČOVÝCH HRÁCH ROMAN POSPĚCH.
Stanice v síti učební texty pro deváté ročníky ZŠ.
Vymezení problému výzkumu Volba oblasti výzkumu Volba metodologického přístupu Formulace hypotéz !REŠERŠE! proč?
Elektronická pošta, zkráceně (zkráceně také mail) je způsob odesílání, doručování a přijímání zpráv přes elektronické komunikační systémy.
© IHAS 2011 Tento projekt je financovaný z prostředků ESF prostřednictvím Operačního programu Vzdělávání pro konkurenceschopnost a státního rozpočtu ČR.
Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
Anotace Materiál slouží pro výuku speciálních oborů, pro žáky oboru zednické práce. Prezentace obsahuje výklad lešení pro zdění a vnitřní omítky.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Jednovýběrový a párový t - test
SOFTWARE Operační systémy.
Business Inteligence – úvod
EBSCO PhDr. Ivana Reznerová
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace
Databázové systémy přednáška 13 – Analýza a reporting
Pohled uživatele Jindřiška Pospíšilová Národní knihovna ČR
VIKMA06 Rešeršní a studijně rozborová činnost
EBSCO PhDr. Ivana Reznerová
Pokus. konec.
Informační systémy podnikové systémy CRM
EBSCO Centrum informačních a knihovnických služeb VŠE
OnLine Analytical Processing ESF MU 2005 J.Skorkovský
EBSCO Centrum informačních a knihovnických služeb VŠE
Knihovny.cz Vyhledávání patentových dokumentů
Transkript prezentace:

Text mining – definice inteligentní analýza textu textový data mining proces extrakce skrytých informací z nestrukturovaného textu používá kombinaci strojového učení, statistické analýzy..

Je to k něčemu? asi jo, jelikož 80% informací je textových ECHELON = sledování komunikačních kanálů (automatická analýza velkého množství dat..)

Rozdíl od hledání na webu Na webu většinou hledáme napsané a známé věci X V text miningu hledáme neznámou informaci

Similarita s data miningem Problém umístění másla v text miningu – vzory jsou extrahovány z normálního jazyka, ne ze strukturovaných databází Pro text mining jsou nejvhodnější NESTRUKTUROVANÉ dokumenty

Computational linguistic = LANGUAGE PROCESSING Extrahování frází -> sumarizace (nejčastější slova bez balastních členů) !Není text mining!

Konkrétní příklad 1 Jména lidí a společností zab. se bezdrátovou technologií Pokus odvodit vztahy mezi firmami, kdo je hlavní atp.. Problém zhodnocení vztahů – je jich hodně ..

Příklad 2 - interakce genů Články zabývajícícmi se geny Nehledáme přímé páry názvy genů + ostatní slova V dalších článcích hledáme právě ostatní slova Překvapivě dobré výsledky

Shrnutí Text Mining = objevení dosud nepublikované informace z velkého množství textu  hledání na webu Existuje něco jako Computational Linguistics Text mining neřeší celý problém, ale může pomoci se dobrat výsledku

Literatura a zdroje 1 http://www.klariti.com/text-mining/index.shtml http://www.mundi.net/trip-m/hearst/ http://www2.sims.berkeley.edu/courses/is296a-4/f99/Lectures/acl99.ppt

Literatura a zdroje 2 http://www.dmreview.com/whitepaper/paper_sub.cfm?whitepaperId=10080 http://www.sims.berkeley.edu/~hearst/text-mining.html http://www.cs.waikato.ac.nz/~nzdl/textmining/

kaja.maly zavinac seznam.cz KONEC Autor: Karel Malý kaja.maly zavinac seznam.cz