Dolování znalostí z vícejazyčných textových dat Luděk Svozil 7. 12. 2015, Brno Vedoucí práce: doc. Ing. František Dařena, Ph.D.

Slides:



Advertisements
Podobné prezentace
 Proč: ◦ Vývoj algoritmů spjatých s medicínskými daty  Členové: ◦ Doktorandi – 4 ◦ Studenti – 7.
Advertisements

Dynamická tuhost pneumatiky
Optimalizace online prezentací v závislosti na vlastnostech produktů David Novák.
Databázové systémy Přednáška č. 3 Proces návrhu databáze.
Strojové učení I (Mitchell93) učicí množina příkladů hledáme generalizaci učicí množiny ověřujeme na testovací množině pokrytí, přesnost, F-kriterium.
Shluková analýza.
Učte se anglicky 4krát rychleji Úvod Dr. Arkady Zilberman *US Patent 6,341,958.
Tvorba dokumentů – kritéria Obsah a forma –aktuálnost a správnost informací, variabilní data, –forma adekvátní příjemci, estetika, –účelná struktura, členění.
Kontrolky ve WPF Jan Lasac Vedoucí práce Ing. Václav Novák, CSc.
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
ZÁVĚREČNÝ SEMINÁŘ Program 4. krajského setkání metodiků Metoda CLIL a výuka odborného cizího jazyka 1.
CCO JE PARTNERSTVÍ  PARTNERSTVÍ A SOV  PARTNERSTVÍ A BUDOUCNOST Ing. Zdeňka Škarková.
SHLUKOVÁNÍ David Zeman FIT VUT UIFS Získávání znalostí z databází Modelování shlukové analýzy v systému SAS Enterprise Miner TM.
ZÁKLADY TEORIE PRAVDĚPODOBNOSTI
1D simulace proudění říčních toků pomocí metody konečných objemů
Název ročníkové práce Vaše Jméno Vedoucí práce: doc. PhDr. Ing. Mgr. Jméno Příjmení, PhD., CSc.
Znalost pojištění ve veřejném mínění Bc. Petr Horák Brno, červen 2012 Vedoucí: Ing. Zuzana Hrdličková, Ph.D. Obhajoba bakalářské práce Oponent: Ing. Ondřej.
Pagination pro formuláře ASP.NET Petr Jelínek Vedoucí práce Ing. Václav Novák, CSc.
MorČe morfologické značkování češtiny
Název projektu Tvorba a realizace kurzů v rámci celoživotního vzdělávání rozšiřujících kvalifikaci v oblasti speciální pedagogiky Tento projekt je spolufinancován.
ACB a DIS Využití kompresní metody ACB pro potřeby DIS Tomáš Skopal VŠB-TU Ostrava.
Obhajoba diplomové práce Sluneční záření a atmosféra
Předzpracování nestrukturovaných dat pomocí jazyka Snowball , Brno Připravil: Bc. Pavel Řezníček.
Analýza průchodu studentů kurzem Vzdělávací technologie 1
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
Laser Simulation DSS Ing. Jana Hájková Doc. Ing. Pavel Herout, Ph.D.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.
OPTIMALIZACE POJISTNÉ OCHRANY V POJIŠTĚNÍ OSOB Autor práce: Ing. Miroslav Čechmánek Vedoucí práce: Ing. Svatopluk Nečas, Ph.D.
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
Úvod do psychologie Barbara Caková Carl Rogers – Sposob bytia.
Školské systémy, vzdělanost a ekonomická výkonnost
Den s románskou filologií FF JČU České Budějovice doc. PhDr. Jan Radimský, Ph.D.
Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
Webová aplikace pro koordinaci výrobních procesů Kryštof Német , Brno Autor: Kryštof Német Vedoucí práce: RNDr. Zuzana Priščáková, PhD.
1 Diplomová práce Sluneční záření a atmosféra Autor: Tomáš Miléř Vedoucí: Doc. RNDr. Petr Sládek, CSc. Oponent: RNDr. Jan Hollan BRNO 2007Katedra fyziky,
Využití ICT ve výuce jazyků. CílCíl Cílem školení je seznámit se s možností využití ICT ve výuce anglického jazyka. Důraz je kladen na osvojení a praktické.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Analýza hypotéčních úvěrů poskytovaných fyzickým osobám v České republice Autor bakalářské práce:Martina Šimková Vedoucí bakalářské práce:Ing. Robert Zeman.
Personální práce v malé organizaci Milada Matyšková.
Vysoká škola technická a ekonomická Ústav technicko-technologický
Doc. Ing. Pavel Pavloušek, Ph.D.
Vysoká škola technická a ekonomická
Úvod do databázových systémů
Řízení vtahů se zákazníky ve vybraném podniku
Návrh podnikatelského plánu založení minipivovaru s vlastní pivnicí
Vysoká škola technická a ekonomická v Českých Budějovicích
Vysoká škola technická a ekonomická České Budějovice Ústav podnikové strategie Zhodnocení finanční situace konkrétního podniku Autor BP: Miroslava Sobotovičová.
Dobývání znalostí z databází dolování dat
Vysoká škola technická a ekonomická
Vysoká škola technická a ekonomická v Českých Budějovicích
Vysoká škola technická a ekonomická
CRM v maloobchodní jednotce se sportovním zbožím
České Budějovice, červen 2016
Analýza merchandisingu a nákupní atmosféry vybrané obchodní jednotky
Metody strojového učení
Automatická indexace Základní metody a postupy
Autor práce: Michaela Janová
Analýza vnitropodnikové komunikace ve vybraném podniku
MEZINÁRODNÍ OBCHOD 2016.
Oceňování nemovitostí
Vysoká škola technická a ekonomická v Českých Budějovicích
Název posteru [velikost 48, písmo Arial Bold]
Oceňování nemovitostí
Datové sklady (Data Warehouse)
Katedra řízení podniku
PROJEKT PŘÍPRAVY A REALIZACE POLYFUNKČNÍHO DOMU
, Brno Připravil: Kryštof Német
Transkript prezentace:

Dolování znalostí z vícejazyčných textových dat Luděk Svozil , Brno Vedoucí práce: doc. Ing. František Dařena, Ph.D.

strana 2 Úvod Dostupnost kvalitního statistického překladu se zvyšuje Spolu s rozšířením internetu neustále přibývá vícejazyčných dat Pro podporu rozhodování by bylo výhodné mít data v jednom společném jazyce Kapitola 1

Cíl práce Ověřit vliv automatického strojového překladu jako jedné z metod předzpracování pří dolování znalostí z textu strana 3

Metodika Bylo třeba navrhnout různé pokusy a pomocí klasifikačních a shlukovacích algoritmů zjistit dopad překladu na tyto problémy Bylo třeba se seznámit s aktuálními postupy v text miningu strana 4

strana 5

Vliv překladu do angličtiny na úspěšnost klasifikace a velikost slovníku u jednotlivých jazyků Byl zjištěn pozitivní vliv na velikost slovníku při zachování podobné úspěšnosti klasifikace strana 6

strana 7

strana 8

strana 9

Porovnání vlivu rule-based a statistického překladu na klasifikaci Statistický překlad je nastupujícím trendem a dá se předpokládat že v budoucnu bude převládat Starší překlad založený na pravidlech se ukázal pro potřeby klasifikace vhodnější, jeho dostupnost pro větší počet jazyků je však značně omezená strana 10

Úspěšnost klasifikace SVM strana 11

strana 12

Další experimenty Porovnání vlivu jazykově závislých a nezávislých metod předzpracování Analýza pomocí shlukování strana 13

Tak, to by bylo.. strana 14