Projekt Perfull Personifikovaný fulltextový vyhledavač Vedoucí: RNDr. Leo Galamboš, Ph.D. Řešitelé: Ondrej Bechera Vojtěch Kulvait Eva Kustrová Ondřej.

Slides:



Advertisements
Podobné prezentace
Web Michal Žůrek Jak se na něj dívám já..
Advertisements

Tagy neboli příkazy Olga Kasafírková Základy HTML.
Tvorba webových stránek
Tutoriál EDS možnosti přizpůsobení Pro administrátory support.ebsco.com.
Základní struktura, metainformace
CZ.1.07/1.4.00/ VY_32_INOVACE_133_IT7 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
PROGRAMOVACÍ JAZYKY (c) Tralvex Yeap. All Rights Reserved.
Základy práce s počítačem – lekce V.
Adobe Dreamweaver CS4 Ing. Martin Dosedla.
Moderní formy tvorby webových stránek Martin Šebela, 9.A vedoucí práce: Mgr. Jan Kříž.
SETKÁNÍ UŽIVATELŮ KNIH. SYS. TINLIB / T SERIES Městská knihovna Chrudim listopadu 2003.
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_257 Název školyGymnázium, Tachov, Pionýrská 1370 Autor Ing. Roman Bartoš Předmět Informatika.
SDRUK-IT Možnosti využití programového vybavení WebArchivu dalšími subjekty Ing. Petr Žabička, MZK.
Strana 1 © Vema, a. s., 7. dubna 2015 Intranetová řešení v PIS DS -Personalis 2005.
Internetové prohlížeče
Internet.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Jan Majer, Tomáš Pytlík, Tomáš Vondráček IKE D o k u m e n t o g r a f i c k é i n f o r m a č n í s y s t é m y.
SIPVZ – Státní informační politika ve vzdělávání w w w. e - g r a m. c z E-gram E-gram Informační a komunikační web SIPVZ 1. Původní web:
Walter Schorge Archa – Open Source archivní informační systém v NTM Archivy, knihovny a muzea v digitálním světě
11. SLUŽBY INTERNETU.
Internetový prohlížeč
Internet.  Celosvětový systém propojených počítačů  Funkce  Sdílení dat  Elektronická pošta.
WWW – hypertextový informační systém
AJAX nejmodernější webová technologie… seminář pro učitele ZŠ a SŠ Mgr. Marek Osuchowski Ostravská univerzita © 2011.
Oborová brána TECH tech.jib.cz Seminář „Okna oborů dokořán! Proč a jak využívat oborové brány & jak dál v CPK? “ Praha, NTK PhDr. Lenka Hvězdová.
Copyright (C) 2000 Vema, a. s.1 V3 klient Michal Máčel Provozní integrace G2, HR/Win a internetu.
Název projektu: Šablony Špičák číslo projektu: CZ.1.07/1.4.00/ šablona III/2 autor výukového materiálu: Mgr. Jana Jiroušová, VM vytvořen: únor 2012,
Filtrace web stránek s využitím profilu uživatele Petr Doskočil
Tiskové služby v sítích Microsoft
organizační struktury Implementace EOS III na Olomouckém kraji Pro:Krajský rok informatiky 2005 Autor:Jan Kadlec Datum:
CZ.1.07/1.4.00/ VY_32_INOVACE_166_IT 9 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Kamasová Silvie 9.C. Mozilla firefox Rychlejší prohlížení webu Blokování vyskakovacích oken Prohlížení stránek v panelech Snadná změna vzhledu Intuitivní.
Podnikání na Internetu internet - zdroj informací Letní semestr 2005 Jana Holá III.
CZ.1.07/1.4.00/ VY_32_INOVACE_154_IT5 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
IDEA Web Systém 5.0 Pavel Bezstarosti IDEA spol. s r.o
Macron Software, spol. s r.o. Nad Petruskou 1, Praha 2, Czech Republic,
2 Karla Halenková Setkání uživatelů 2001 Báze znalostí produkt pro naplnění uživatelem.
Jan Růžička, Leden /01/05 Proč pro prezentaci prostorových dat využívat nástrojů WWW Nízké náklady na vybavení klientského počítače Snadné zvýšení.
KURZ ZÁKLADY PRÁCE S POČÍTAČEM 1 Vyhledávání na internetu Autor: Mgr. Aleš Kozák.
Internet a informace MIS - Manažerské informační systémy Internet a informace Ing. Jan Luhan
1 Základy marketingového výzkumu Online marketing.
Rezervační systém v prostředí XUL Zdeněk Novák, Petr Ondrejka.
Marcel Ondráček Martin Kasalý Petr Hanych.  je počítačový program, který slouží k prohlížení World Wide Webu  Program umožňuje komunikaci s HTTP serverem.
Databáze MS ACCESS 2010.
Využití sestavy Zobrazení a typy Části sestavy Vytvoření sestavy Ovládací prvky.
WEBOVÝ PROHLÍŽEČ. Charakteristika: Webový prohlížeč je počítačový program, který slouží k zobrazování a prohlížení World Wide Webu (WWW), tj. internetu.
Jak fungují webové stránky Úvod do HTML (1). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická.
Web server SEA a monitorování dat pomocí tabletu nebo „chytrého“ telefonu Jan Voříšek.
EU peníze školám Registrační číslo projektu CZ.1.07/1.4.00/ Název projektu Inovace školství Šablona - název Inovace a zkvalitnění výuky prostřednictvím.
Internet. je celosvětový systém navzájem propojených počítačových sítí („síť sítí“), ve kterých mezi sebou počítače komunikují pomocí rodiny protokolů.
 = jedná se o vzájemné propojení lokálních počítačových sítí pomocí vysokorychlostních datových spojů  vznikl spojením mnoha menších sítí  v každé.
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
Workshop, Knihovna AV ČR, 4. října 2010 Mgr. Tomáš Foltýn Kramerius 4 Uživatelské rozhraní Do verze
Zabezpečení – CSRF, XSS Tomáš Hulák, Miroslav Kořínek.
Anotace Materiál je určen pro 1. ročník studijního oboru M/01 PROVOZ A EKONOMIKA DOPRAVY, předmětu Informační a komunikační technologie, inovuje.
Výpočetní technika VY_32_INOVACE_16_16_internetový prohlížeč.
Přehled změn na portálu upgrade redakčního systému Marwel, nasazení modulu pro správu souborů a fulltextové vyhledávání
Jakub Dražan, Václav Dobeš, Petr de Gier, Veronika Černohorská Zadavatel: Ondřej Macek.
Tribuna českého obchodu TZB
NÁZEV ŠKOLY:SOŠ Net Office, spol. s r.o. Orlová Lutyně
Vyhledávání v Internetu
školák Piš a sdílej své sešity, jednoduše, rychle, v pohodě.
TIPY A RADY PRO PRÁCI S WEB OF SCIENCE – SLUŽBY DOSTUPNÉ PO REGISTRACI
Internetové prohlížeče
Přehled změn na portálu
Přehled změn na portálu
Nové webové mapové aplikace ČGS RNDr. Vít Štrupl, PhD. Nesuchyně 4. 4
Transkript prezentace:

Projekt Perfull Personifikovaný fulltextový vyhledavač Vedoucí: RNDr. Leo Galamboš, Ph.D. Řešitelé: Ondrej Bechera Vojtěch Kulvait Eva Kustrová Ondřej Luks Dušan Maruščák Jan Nepožitek

Cíle projektu Zájmy uživatele se zjišťují pomocí spy modulu, který sleduje jaké odkazy v prohlížeči uživatel volí. Zobrazované stránky se automaticky zaindexovávají na fulltextovém stroji. Robot stahuje odkazy vedoucí ze stránek, které uživatel navštívil. Pravděpodobnost volby odkazu (pro výpočet personálního pageranku) se určuje na základě sémantické polohy odkazu v HTML stránce. Například odkaz fontem small v záhlaví nebo patičce je méně významný než odkaz fontem normal ve větě v běžném para. Integrace vyhledávače do prohlížeče Mozilla pomocí aplikačního rozšíření via toolbar(postranní panel). Řešení využívá vyhledávací systém Egothor.

K čemu je to dobré? Vyhledávání stránek relevantních pro určitého uživatele Řazení výsledků podle pageranku zavislého na chování uživatele Umožňuje vyhledávání v uživatelově historii Pagerank závisí na lidském procházení stránek, nezahlcuje se umělým spamem Sběr dat bez obtěžování uživatele

Perfull vs. Nepersonifikovaná řešení PerfullOstatní Fulltextové vyhledáváníANO Řazení podle důležitostiANO Řazení podle profilu uživatele ANONE Archivní verze stránekANO Možnost provozování vlastního serveru ANONE Podpora SSLANONE

K čemu to může být dobré? Při slévání mnoha uživatelských indexů lze vytvořit vyhledávací index s vyšší relevancí Sběr dat o chování uživatelů pro další výzkum Přidáním uživatelského hodnocení stránek lze vytvořit uživatelsky řízený pagerank

Součásti Perfull server Mozilla Firefox extension Perfull tracer

Perfull Server Centralizované řešení Jeden server pro více uživatelů Uživatelské indexy jsou odděleny Programovací jazyk: J2SE 5.0

Perfull Server (Modul BUS) Základní sběrnice pro komunikaci mezi moduly. Funguje na principu posílaní eventů. Umožňuje zpracovávání podle priorit, paralelní i sériové zpracování jednotlivých eventů.

Perfull Server (Modul SERVER) Komunikace s Firefoxem a Tracerem zabezpečená, pomocí SSL protokolu.

Perfull Server (Modul CRAWLER) Automaticky prochází indexované stránky a načítá odkazy do určité hloubky.

Perfull Server (Modul INDEXERSEARCHER) Zpracovává stránky a udržuje si informace o nich Ukládá obsah stránek do indexovacího stroje (Egothor) Vyhledává uživatelské dotazy v indexu a řadí výstup podle pageranku Generování preview, xml, transformace do xhtml

Perfull Server (Modul PAGERANK) Vypočítává pagerank pro indexované stránky. Personifikovaná metoda “Google” metoda

Perfull Server (Modul SETUPER) Management uživatelských profilů, generování nastavení pro Firefox

Mozilla Firefox extension klientská část, spouští se automaticky s prohlížečem Programovací jazyk: JavaScript + XUL

Získává informace z Mozilly, URL, čas strávený na stránce. Mozilla Firefox extension(Modul SPY)

Mozilla Firefox extension(Modul VIEW) Postranní lišta do Mozilly, ve které uživatel zadává vyhledávací příkazy a dostává zobrazené výsledky. JavaScript spolu s formátem XUL je standardně používán na tvorbu rozšíření pro Firefox.

Perfull tracer Programovací jazyk: J2SE 5.0 Swingová aplikace Perfull tracer slouží pro správu indexu uživatele. Zobrazuje taktéž pro uživatele relevantní informace, co se s jeho indexem a zaindexovanými stránkami právě děje.

Videoprezentace Spuštení Indexace, vyhledávání, pagerank