Jak funguje vyhledávání podobností Šimon Suchomel.

Slides:



Advertisements
Podobné prezentace
© 2000 VEMA počítače a projektování spol. s r. o..
Advertisements

Webové rozhraní pro datové úložiště
Dana Sigmundová Zásady vyhledávání, správná technika vyhledávání, databáze EBSCO ÚK FSS MU, úterý a středa 11. a Ústřední knihovna FSS MU.
IS. MUNI. CZ a služba pro odhalování plagiátů 7
Národní systémy na odhalování plagiátů Jitka Brandejsová, Masarykova univerzita, Fakulta informatiky Plagiátorství na vysokých školách, APUA, Brno,
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
Dana Sigmundová E-books jako zdroj odborných informací ÚK FSS MU, Ústřední knihovna FSS MU.
Podpora PR oddělení fakulty moderními ICT
Návrh architektury moderních informačních systémů
Zpracování informací a znalostí Přesnost a úplnost vyhledávání
Praha6.cz Nové trendy v e-publishingu Statické stránky, mapa stránek, menu a fulltextové vyhledávání.
ReStEP – Základní informace Plný název: ReStEP – Regional Sustainable Energy Policy based on the Interactive Map of Sources (Regionální udržitelná energetická.
DSPACE na ZČU v Plzni 5. setkání uživatelů Dspace, Ostrava Ing. Radka Tichá Mgr. Anna Andrlová.
Best practices aneb jak nepostupovat Růžena Krhutová.
EBSCO Knihovna FSS MU a Osnova EIZ – co, proč, kde EBSCO Vychytávky Procvičování.
Ochrana aktiv v malé firmě Bakalářská práce Pavel Šnajdr – Aplikovaná informatika.
Vyhledávání podobností v datech s využitím singulárního rozkladu
Spisová služba „light“
Serials Solutions – další krok k rozvoji informačních e-služeb knihoven ČVUT Ilona Trtíková Bibliotheca academica – Cíle a perspektivy vysokoškolských.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Studijní IS a spisová služba Miroslav Křipač
Rozšíření IQ sestav v RZ Jak zobrazovat data na 100% ? Ing. Robert Naar Skalský Dvůr
REALIZACE PŘEVODU NA CENTRÁLNÍ SYSTÉM správních evidencí MV Zrušení okresních počítačů Nové funkcionality Nový přístup externích subjektů Čištění dat Školení.
Identifikace Mendelovy univerzity v Brně ve vědeckém světě Lukáš Plch Informační centrum
Šedá literatura Zuzana Janušová.
Systémová integrace Big Data
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
Realizační tým ICZ duben 2005
Internetové publikování Doc. Ing. Petr Zámostný, Ph.D. místnost: A-72a tel.: 4222, 4167 (sekretariát ústavu 111)
Digitalizace a archivace dokumentů státní sociální podpory
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Dana Sigmundová Metalib aneb jak vyhledávat (skoro) ve všech (multi)oborových databázích současně? ÚK FSS MU, Ústřední knihovna FSS MU.
Dana Mazancová Metalib aneb jak vyhledávat (skoro) ve všech (multi)oborových databázích současně? ÚK FSS MU, 8. a Ústřední knihovna FSS MU.
Automatizovaná podpora výběru nástroje pro dobývání znalostí Jakub Štochl.
Studijní IS a plagiáty Růžena Zemanová.
Novinky ve vývoji Martin Stančík 2014.
Jak vyhledávat informace na Internetu?
EVALUACE WWW ELEKTRONICKÉ INFORMAČNÍ ZDROJE Petr Sejk
Daniel Jakubík Repozitář vědeckých prací.
Dana Sigmundová Jak najít plný text článku nebo kompletní číslo odborného časopisu aneb článkové databáze a jak v nich vyhledávat ÚK FSS MU,
Plošná inovace předmětů s využitím e- learningových nástrojů Informačního systému Masarykovy univerzity (IS MU)
Přístup do IS z mobilních zařízení Tomáš Tureček Katedra Informatiky FEI VŠB-TU Ostrava.
Abychom neobjevovali znovu kolo!!! „Východiskem vědeckého studia musí být pečlivé prostudování existující literatury o dané otázce, abychom nezjišťovali.
Ústřední knihovna FSS MU Zprávám z médií a tisku na stopě!
Základy práce s informačními zdroji pro bc. studenty SPSP Mgr. Dana Mazancová, DiS. Brno, 11. dubna 2013 Masarykova univerzita Fakulta sociálních studií.
1 E - S V Ě T S E T O Č Í S T Á L E R Y C H L E J I. S T A Č Í T E M U ? Fenix II –IS na platformě.NET Michal Varga.
2 Karla Halenková Setkání uživatelů 2001 Báze znalostí produkt pro naplnění uživatelem.
Projekt LISp-Miner Milan Šimůnek. Milan Šimůnek – Projekt LISp-Miner2 Obsah Význam databází a uchovávaných informací Proces dobývání znalostí z databází.
Dana Sigmundová Databáze Wiley ÚK FSS MU, Ústřední knihovna FSS MU.
Informační zdroje pro volbu povolání Technika a technické vzdělávání 2.
Ing. Petr Sochor Výhody spolupráce OBD a DSpace Ing. Petr Sochor
Vymezení problému výzkumu Volba oblasti výzkumu Volba metodologického přístupu Formulace hypotéz !REŠERŠE! proč?
Geografické informační systémy pojetí, definice, součásti
Selekční jazyky Současné trendy Přednáška č. 5 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví.
INFORMAČNÍ SYSTÉMY PRO KRIZOVÉ ŘÍZENÍ POUŽITÍ INFORMAČNÍCH SYSTÉMŮ PRO MODELOVÁNÍ A SIMULACE KRIZOVÝCH SITUACÍ - T3 ING. JIŘÍ BARTA Operační program Vzdělávání.
Odhalování plagiátů, citační normy, právní aspekty Ľuboš Lunter.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
VYSOKÁ ŠKOLA TECHNICKÁ A EKONOMICKÁ V ČESKÝCH BUDĚJOVICÍCH Plánování zakázek ve vybraném výrobním podniku ÚSTAV PODNIKOVÉ STRATEGIE Autorka bakalářské.
Knihovna UTB ve Zlíně a její (nejen) elektronické služby PhDr
Knihovna a její služby v 21. století
ESPON – Identifikace územních aspektů informační společnosti
Evidence aplikací a jejich dokumentace
VYSOKÁ ŠKOLA TECHNICKÁ A EKONOMICKÁ V ČESKÝCH BUDĚJOVICÍCH
Nástroje podpory uživatelů
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Informační zdroje pro vědu a výzkum na ČZU
Národní databáze patentů a užitných vzorů
Adresace v Internetu (1)
Transkript prezentace:

Jak funguje vyhledávání podobností Šimon Suchomel

Přehled ▫ Motivace ▫ Náhled na architekturu systému ▫ Modul pro vyhledávání z Internetu ▫ Modul pro detailní porovnání Informační systém Masarykovy univerzity

Teze Informační systém Masarykovy univerzity ▫ Standardní postup při plagiátorství z Webu ▫ Simulací stejného postupu se dostaneme ke stejným dokumentům Převzato z Potthast a kol. Overview of the 4th International Competition on Plagiarism Detection

Generický proces Informační systém Masarykovy univerzity

Hlavní kroky vybírání kandidátních dokumentů Analýza textu Dotazování Stahování a zpracování dokumentů z Webu Informační systém Masarykovy univerzity

Analýza textu ▫ Čištění a předzpracování dokumentu ▫ Detekce jazyka ▫ Extrakce klíčových slov ▫ Analýza změn charakteru textu ▫ Formulace dotazů ▫ Permanentní uchování metainformací Informační systém Masarykovy univerzity Převzato z: Weideman, M Website Visibility: the theory and practice of improving rankings Chandos Publishers, Oxford, UK. ISBN

Dotazování ▫ Řízené dotazování ▫ Zpětná vazba ▫ Náročná operace Informační systém Masarykovy univerzity

Stahování a zpracování ▫ Vysoce paralelizovatelné ▫ Stahování je rychlejší ▪ Požadavky na úložiště ▪ Provoz serverů ▫ Konverze do textu pro výpočet charakteristik Informační systém Masarykovy univerzity

Detailní porovnání ▫ Neustálý distribuovaný výpočet charakteristik nových a změněných dokumentů Informační systém Masarykovy univerzity Převzato z

Detailní porovnání ▫ Lze redukovat na porovnání páru ▫ Obrovské množství dokumentů si žádá speciální zacházení ▫ Více charakteristik textu ▫ Zarovnání do platných intervalů ▫ Po „zkontrolování“ jsou výsledky porovnání okamžité Informační systém Masarykovy univerzity

Shrnutí ▫ Systém poskytuje detailní porovnávání dokumentů nad rychle rostoucí rozsáhlou bází dat s relevantními dokumenty Informační systém Masarykovy univerzity

Děkuji za pozornost Informační systém Masarykovy univerzity