Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Projekt Perfull Personifikovaný fulltextový vyhledavač Vedoucí: RNDr. Leo Galamboš, Ph.D. Řešitelé: Ondrej Bechera Vojtěch Kulvait Eva Kustrová Ondřej.

Podobné prezentace


Prezentace na téma: "Projekt Perfull Personifikovaný fulltextový vyhledavač Vedoucí: RNDr. Leo Galamboš, Ph.D. Řešitelé: Ondrej Bechera Vojtěch Kulvait Eva Kustrová Ondřej."— Transkript prezentace:

1 Projekt Perfull Personifikovaný fulltextový vyhledavač Vedoucí: RNDr. Leo Galamboš, Ph.D. Řešitelé: Ondrej Bechera Vojtěch Kulvait Eva Kustrová Ondřej Luks Dušan Maruščák Jan Nepožitek

2 Cíle projektu Zájmy uživatele se zjišťují pomocí spy modulu, který sleduje jaké odkazy v prohlížeči uživatel volí. Zobrazované stránky se automaticky zaindexovávají na fulltextovém stroji. Robot stahuje odkazy vedoucí ze stránek, které uživatel navštívil. Pravděpodobnost volby odkazu (pro výpočet personálního pageranku) se určuje na základě sémantické polohy odkazu v HTML stránce. Například odkaz fontem small v záhlaví nebo patičce je méně významný než odkaz fontem normal ve větě v běžném para. Integrace vyhledávače do prohlížeče Mozilla pomocí aplikačního rozšíření via toolbar(postranní panel). Řešení využívá vyhledávací systém Egothor.

3 K čemu je to dobré? Vyhledávání stránek relevantních pro určitého uživatele Řazení výsledků podle pageranku zavislého na chování uživatele Umožňuje vyhledávání v uživatelově historii Pagerank závisí na lidském procházení stránek, nezahlcuje se umělým spamem Sběr dat bez obtěžování uživatele

4 Perfull vs. Nepersonifikovaná řešení PerfullOstatní Fulltextové vyhledáváníANO Řazení podle důležitostiANO Řazení podle profilu uživatele ANONE Archivní verze stránekANO Možnost provozování vlastního serveru ANONE Podpora SSLANONE

5 K čemu to může být dobré? Při slévání mnoha uživatelských indexů lze vytvořit vyhledávací index s vyšší relevancí Sběr dat o chování uživatelů pro další výzkum Přidáním uživatelského hodnocení stránek lze vytvořit uživatelsky řízený pagerank

6 Součásti Perfull server Mozilla Firefox extension Perfull tracer

7 Perfull Server Centralizované řešení Jeden server pro více uživatelů Uživatelské indexy jsou odděleny Programovací jazyk: J2SE 5.0

8 Perfull Server (Modul BUS) Základní sběrnice pro komunikaci mezi moduly. Funguje na principu posílaní eventů. Umožňuje zpracovávání podle priorit, paralelní i sériové zpracování jednotlivých eventů.

9 Perfull Server (Modul SERVER) Komunikace s Firefoxem a Tracerem zabezpečená, pomocí SSL protokolu.

10 Perfull Server (Modul CRAWLER) Automaticky prochází indexované stránky a načítá odkazy do určité hloubky.

11 Perfull Server (Modul INDEXERSEARCHER) Zpracovává stránky a udržuje si informace o nich Ukládá obsah stránek do indexovacího stroje (Egothor) Vyhledává uživatelské dotazy v indexu a řadí výstup podle pageranku Generování preview, xml, transformace do xhtml

12 Perfull Server (Modul PAGERANK) Vypočítává pagerank pro indexované stránky. Personifikovaná metoda “Google” metoda

13 Perfull Server (Modul SETUPER) Management uživatelských profilů, generování nastavení pro Firefox

14 Mozilla Firefox extension klientská část, spouští se automaticky s prohlížečem Programovací jazyk: JavaScript + XUL

15 Získává informace z Mozilly, URL, čas strávený na stránce. Mozilla Firefox extension(Modul SPY)

16 Mozilla Firefox extension(Modul VIEW) Postranní lišta do Mozilly, ve které uživatel zadává vyhledávací příkazy a dostává zobrazené výsledky. JavaScript spolu s formátem XUL je standardně používán na tvorbu rozšíření pro Firefox.

17 Perfull tracer Programovací jazyk: J2SE 5.0 Swingová aplikace Perfull tracer slouží pro správu indexu uživatele. Zobrazuje taktéž pro uživatele relevantní informace, co se s jeho indexem a zaindexovanými stránkami právě děje.

18 Videoprezentace Spuštení Indexace, vyhledávání, pagerank


Stáhnout ppt "Projekt Perfull Personifikovaný fulltextový vyhledavač Vedoucí: RNDr. Leo Galamboš, Ph.D. Řešitelé: Ondrej Bechera Vojtěch Kulvait Eva Kustrová Ondřej."

Podobné prezentace


Reklamy Google