Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek.

Slides:



Advertisements
Podobné prezentace
Vyhledávací stoje na Internetu. (vyhledavače pro začátečníky)
Advertisements

Sloveso BÝT – minulý čas
Adjectives Comparative/Superlative Stupňování přídavných jmen
Microsoft Access Jiří Beran MS Access Jiří Beran.
Sloveso BÝT – přítomný čas
 Taggmanager.cz je nový způsob komunikace umožňující jednoduché propojení mobilního telefonu se speciálním webovým obsahem vyvíjený pod záštitou ministerstva.
Semestrální práce KIV/PT Martin Kales Hana Hůlová.
Živá a neživá příroda Přírodověda 4. ročník.
VYHLEDÁVÁNÍ V DIGITÁLNÍ KNIHOVNĚ VYSOKOŠKOLSKÝCH KVALIFIKAČNÍCH PRACÍ DSPACE.
METODIKA TVORBY ODBORNÉHO TEXTU
Optimalizace v simulačním modelování. Obecně o optimalizaci  Optimalizovat znamená maximalizovat nebo minimalizovat parametrech (např. počet obslužných.
1 Vyhledávání Principy vyhledávání Klasifikace klíče:  Interní klíč – je součástí prohlížených záznamů  Externí klíč – není jeho součástí, je jím např.
Název školy Základní škola Domažlice, Komenského 17 Číslo projektu CZ.1.07/1.4.00/ Název projektu „EU Peníze školám ZŠ Domažlice“ Číslo a název.
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
3MA381 – Manažerská informatika Lucie Bjačková. Co je to LaTeX?  Systém určený k sazbě vědeckých a matematických dokumentů  Postaven na typografickém.
Výukový program: Obchodní akademie Název programu: Tvorba vzorců Vypracoval: Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
2 Martin Sedlák 3  výukový software  naučí pracovat s aplikacemi Microsoft Office Word, Excel a PowerPoint  rozsah – začátečníci i pokročilí.
Jiří Znoj - zno Tvorba konkordace Algoritmy II 3. projekt, 5. zadání Jiří Znoj - zno
Simulační modely a programové vybavení. Vývoj simulačních programů  Původně pouze strojový kód –Příliš dlouhé, náročné na programátora, obtížné hledání.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
ŠKOLA:Gymnázium, Tanvald, Školní 305, příspěvková organizace ČÍSLO PROJEKTU:CZ.1.07/1.5.00/ NÁZEV PROJEKTU:Šablony – Gymnázium Tanvald ČÍSLO ŠABLONY:VI/2.
Internetový portál Informační systémy ve státní správě a samosprávě.
Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorIng. Ivana Brhelová Název šablonyIII/2.
Práce s tabulkami.
Druhy diagramů Ing. Jiří Šilhán.
Motivační dopis zadání
Použití ozdobného písma (fontu)
Název školy Základní škola Domažlice, Komenského 17 Číslo projektu CZ.1.07/1.4.00/ Název projektu „EU Peníze školám ZŠ Domažlice“ Číslo a název.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Řešitel: Jméno Příjmení Spoluřešitel: Jméno Příjmení.
MS Word Hromadná korespondence v MS Word 2007.
NÁZEV ŠKOLY: Základní škola Javorník, okres Jeseník REDIZO:
EBSCO Ramis Václavík Centrum informačních a knihovnických služeb Odbor informační podpory studia a výzkumu
Aplikace vyhledávače Google na zdroje odborných informací
hledání zlepšující cesty
Jak vyhledávat informace na Internetu?
HYPERTEXTOVÉ ODKAZY V PowerPointu 2010.
Grafický zápis algoritmů (vývojové diagramy) Eratosthenovo síto
Datový model Vít Ochozka. Databáze MS SQL Jedna databáze Otevřený model Správce NIS má nástroje ke správě –Management studio –AKORD_DA (ADMIN) Datový.
5. Polohové vytyčování Přesnost vytyčení polohy bodu polární metodou
Název školy Základní škola Domažlice, Komenského 17 Číslo projektu CZ.1.07/1.4.00/ Název projektu „EU Peníze školám ZŠ Domažlice“ Číslo a název.
I´ve got big nose Části hlavy + přídavná jména Anglický jazyk 3.ročník J.Poláková ZŠ Věšín.
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorIng. Ivana Brhelová Název šablonyIII/2.
Šablona: Inovace a zkvalitnění výuky prostřednictvím ICT Vzdělávací oblast:Informační a komunikační technologie Předmět:Informatika Ročník: 8. Datum vytvoření:Únor.
Výuka základů algoritmického myšlení na prvním stupni základních škol
Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice, Benešovo náměstí 1, p.o. Tematický celek: Microsoft Excel Kód a název materiálu:
Vypracováno kolektivem autorů České společnosti pro technickou normalizaci Úřad pro technickou normalizaci, metrologii a státní zkušebnictví
Rudolf Rosa Strojový překlad pojmenovaných entit za pomoci Wikipedie.
Vysoká škola ekonomická v Praze :: Jména a příjmení Datum vyhotovení: Bakalářská práce.
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
Internetová doména a její název Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín Tematická oblastInternetové technologie, programování.
Finanční matematika 2. (finanční gramotnost) Z á k l a d n í p o j m y.
Číslo projektuCZ.1.07/1.5.00/ Název školyGymnázium, Soběslav, Dr. Edvarda Beneše 449/II Kód materiáluVY_62_INOVACE_11_05 Název materiáluÚrokovací.
Základní škola Čelákovice VY_32_INOVACE_027_Složené zlomky.
SOFTWARE Operační systémy.
Zobrazení přímky a roviny
Kód materiálu: VY_32_INOVACE_04_BAROKNI_UMENI Název materiálu:
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
AUTOR: Mgr. Ludmila Faiková
Implementace steganografických algoritmů
Textový editor – Microsoft WORD 2007
Výukový materiál zpracovaný v rámci projektu EU peníze školám.
Výukový materiál zpracován v rámci projektu EU peníze školám
Informatika textový editor - WORD
Základní škola a Mateřská škola Libáň, okres Jičín Moderní škola 2010
5 tipů pro zjednodušení práce
Základní škola T. G. Masaryka, Bojkovice, okres Uherské Hradiště
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Vypočítej tabulky a+b a b
Transkript prezentace:

Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek

Pojmenované entity jsou vlastní jména… …ale nejen to: –data ( ) –částky (5000 $) –názvy firem (Microsoft) –zeměpisné názvy (Mount Everest) mohou být i víceslovné

Můj program pracuje s anglickými texty pracuje s anglickými texty hledá pouze vlastní jména hledá pouze vlastní jména (pro zjednodušení) využívá Collinsovu metodu využívá Collinsovu metodu

Collinsova metoda hledá tzv. spínače hledá tzv. spínače využívá krátký seznam NENT využívá krátký seznam NENT počítá četnosti slov před a po NENT počítá četnosti slov před a po NENT slova s danou četností označí jako spínače slova s danou četností označí jako spínače pomocí spínačů rozšíří seznam NENT pomocí spínačů rozšíří seznam NENT postup opakuje postup opakuje

Collinsova metoda příklad: příklad: Jiří Pytlíček, prom. mat. => kandidát na spínač Mr. Oistrakh => kandidát na spínač

Klady a zápory + jednoduchý algoritmus - pomalý - ne příliš přesný