Ing. Alžběta Králová kralova@sefira.cz SEFIRA spol. s r.o. 7.4.2019 Fulltextové vyhledávání a ConText CZ Ing. Alžběta Králová kralova@sefira.cz SEFIRA spol. s r.o. 7.4.2019
Technologie Oracle Text 7.4.2019 Technologie Oracle Text Fulltextová technologie plně integrovaná v DB Oracle 1996 – Oracle Context Cartridge ve verzi 7.3.2 dnes – Oracle Text Rozšíření funkčnosti původní Oracle Context Cartridge (interMedia Cartridge) o práci s českými a slovenskými texty Lokalizace lingvistické funkce STEM pomocí metod matematické lingvistiky - možnost vyhledání slov v dokumentech ve všech časech, resp. pádech - vyhledávání podle stejného slovního základu nebo kmene Vyhledávání s funkcí STEM příklad: po zadání vyhledání slova jíst bude výsledková sada obsahovat i dokumenty obsahující toto slovo i ve tvarech jedla, jez, jíme atd Možnost použití Oracle Context CZ, SK i v již existujících aplikacích nad databází Oracle Výrazně rozšiřuje schopnosti RDBMS Oracle podporovat všechny typy uživatelů a všechny typy dat 7.4.2019
Způsoby uložení textů pro indexaci 7.4.2019
ConText CZ Lokalizace lingvistického operátoru STEM 1996 – SEFIRA provedla lokalizaci (jako 4. jazyk) Ve spolupráci SEFIRA + matematičtí lingvisté UK Využívá slovník obsahující 700 tisíc slovních základů 700 tisíc slovních základů pokrývá 98 % českého jazyka Podpora smíšených textů s diakritikou nebo bez diakritiky 7.4.2019
Případová studie – informační portál 7.4.2019
Případová studie – informační portál 7.4.2019
Případová studie – informační portál 7.4.2019
Případová studie – informační portál 7.4.2019
Vyhledávání v XML záznamu 7.4.2019
Vyhledávání v celém XML záznamu 7.4.2019
XML záznam – pole Nakladatelské údaje 7.4.2019
Vyhledávání v celém XML záznamu 7.4.2019
XML záznam – pole Název 7.4.2019
Vyhledávání v poli XML záznamu 7.4.2019
Vyhledávání v poli XML záznamu 7.4.2019
Oracle text – indexace databáze 7.4.2019
Oracle Text – vyhledávání 7.4.2019
Oracle Text + ConText CZ – vyhledávání 7.4.2019
Uplatnění Oracle Text/ConText CZ v aplikacích Nejvýhodnější řešení fulltextu pro Oracle technologie index uložen přímo v databázi plně integrované – využívá plně výhod Oracle technologií (administrace, výkon, škálovatelnost…) technologie Oracle Text je v rámci licence DB Oracle jednoduchá implementace ConText CZ dostupný pro všechny verze databáze Oracle: 7, 8, 8i, 9i, 10g Lze připravit řešení pro indexaci a vyhledávání v datech uložených v jiných DB technologiích. 7.4.2019
Reference (1) Průmysl Banky, pojišťovny Telekomunikace Biocel, a.s. ČEZ, a.s. Chemopetrol, a.s. KAUČUK, a.s. Nová huť, a.s. Pražské vodárny a kanalizace Středočeská energetická a.s. Unipetrol, a.s. Banky, pojišťovny ČNB ČNB – zúčtovací centrum Citibank, a.s. Telekomunikace T-Mobile Czech Republic a.s. Obchodní organizace Globe 21 a.s. – Panorama Group a.s. 7.4.2019
Reference (2) Státní správa a školství Zdravotnictví Média Centrum vědecko-technických informácií SR České vysoké učení technické Gymnázium Jiřího Ortena Kriminalistický ústav Praha Mendlova zemědělská a lesnická univerzita v Brně Městský úřad Kladno Městský úřad Moravská Třebová Ministerstvo vnitra ČR Místní úřad Praha 10 Místní úřad Praha 12 Technická univerzita v Liberci Univerzita Hradec Králové Univerzita Pardubice Úřad průmyslového vlastnictví Ústav pro informace ve vzdělávání Veterinární a farmaceutická univerzita Brno Západočeská univerzita Zdravotnictví Státní ústav pro kontrolu léčiv Média Česká tisková kancelář Economia Online (iHNed) 7.4.2019
7.4.2019 Dotazy 7.4.2019