Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek
2
Pojmenované entity jsou vlastní jména… …ale nejen to: –data (13.12.2007) –částky (5000 $) –názvy firem (Microsoft) –zeměpisné názvy (Mount Everest) mohou být i víceslovné
3
Můj program pracuje s anglickými texty pracuje s anglickými texty hledá pouze vlastní jména hledá pouze vlastní jména (pro zjednodušení) využívá Collinsovu metodu využívá Collinsovu metodu
4
Collinsova metoda hledá tzv. spínače hledá tzv. spínače využívá krátký seznam NENT využívá krátký seznam NENT počítá četnosti slov před a po NENT počítá četnosti slov před a po NENT slova s danou četností označí jako spínače slova s danou četností označí jako spínače pomocí spínačů rozšíří seznam NENT pomocí spínačů rozšíří seznam NENT postup opakuje postup opakuje
5
Collinsova metoda příklad: příklad: Jiří Pytlíček, prom. mat. => kandidát na spínač Mr. Oistrakh => kandidát na spínač
6
Klady a zápory + jednoduchý algoritmus - pomalý - ne příliš přesný
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.