Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek.

Podobné prezentace


Prezentace na téma: "Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek."— Transkript prezentace:

1 Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek

2 Pojmenované entity jsou vlastní jména… …ale nejen to: –data (13.12.2007) –částky (5000 $) –názvy firem (Microsoft) –zeměpisné názvy (Mount Everest) mohou být i víceslovné

3 Můj program pracuje s anglickými texty pracuje s anglickými texty hledá pouze vlastní jména hledá pouze vlastní jména (pro zjednodušení) využívá Collinsovu metodu využívá Collinsovu metodu

4 Collinsova metoda hledá tzv. spínače hledá tzv. spínače využívá krátký seznam NENT využívá krátký seznam NENT počítá četnosti slov před a po NENT počítá četnosti slov před a po NENT slova s danou četností označí jako spínače slova s danou četností označí jako spínače pomocí spínačů rozšíří seznam NENT pomocí spínačů rozšíří seznam NENT postup opakuje postup opakuje

5 Collinsova metoda příklad: příklad: Jiří Pytlíček, prom. mat. => kandidát na spínač Mr. Oistrakh => kandidát na spínač

6 Klady a zápory + jednoduchý algoritmus - pomalý - ne příliš přesný


Stáhnout ppt "Vyhledávání pojmenovaných entit Named Entity Recognition Martin Hejtmánek."

Podobné prezentace


Reklamy Google