vyhledávací nástroje, neviditelný web

Slides:



Advertisements
Podobné prezentace
Vyhledávací stoje na Internetu. (vyhledavače pro začátečníky)
Advertisements

Obsah prezentace 1.Co je RSS 2.Možnosti využití RSS 3.Popis systému cíleného doručování vědeckých a odborných článků 4.Ukázka systému 5.Závěr.
Ondřej Pečený Patří do muzea? Ondřej Pečený
Internet Název materiálu: VY_INOVACE_xxx_internet2
Organisation for Economic Cooperation and Development OECD iLibrary.
Tutoriál EDS možnosti přizpůsobení Pro administrátory support.ebsco.com.
Dana Sigmundová Zásady vyhledávání, správná technika vyhledávání, databáze EBSCO ÚK FSS MU, úterý a středa 11. a Ústřední knihovna FSS MU.
New Catholic Encyklopedia Gale Virtual Reference Library (producent Thomson Gale)
SEO pro novou firmu Bartošová Lenka 3MA
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Školení internetového vyhledávače
Školení internetového vyhledávače. Co je to internetový vyhledávač Aplikace na internetu,která dokáže podle klíčového slova najít internetovou.
Tutoriál MEDLINE Complete ~ Vyhledávání support.ebsco.com.
Manažerské informační systémy Ing. Dagmar Řešetková
Vyhledávání na Internetu
INTERNETOVÉ VYHLEDÁVAČE
Bibliografická a rešeršní činnost
Tutoriál EBSCO Discovery Service ~ Jednoduché vyhledávání
Informace – vyhledávání informací
SEO SEO Optimalizace webových stránek pro vyhledávače Jan Nemrava, KIZI, FIS VŠE
EBSCO Knihovna FSS MU a Osnova EIZ – co, proč, kde EBSCO Vychytávky Procvičování.
Tutoriál Vyhledávání v obchodních databázích Business Source
Manažerské informační systémy Ing. Dagmar Řešetková
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Informační zdroje GEOLOGIE.
Internet.  Celosvětový systém propojených počítačů  Funkce  Sdílení dat  Elektronická pošta.
Studijní informační zdroje (a jak se k nim dostat) Informační blok k předmětu Jazykový projev (2012/13)
WWW – hypertextový informační systém
ANOTACEPrezentace obsahuje informace o práci s vyhledávačem Google. Druh učebního materiáluDUM Očekávané výstupy Žáci umí použít vyhledávač Google k vyhledávání.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Projekt A5 Nástroje informatiky pro získávání informací a jejich zpracování.
Web 2.0, folksonomie a uživatelská rozhraní Lenka Němečková Eliška Pavlásková Založeno mimo jiné na prezentacích prof. B. Whitea „The Promise of Rich User.
1 Aplikace folksonomií v uživatelském rozhraní Jednotné informační brány Lenka Němečková Eliška Pavlásková
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK iHOP - plnotextové vyhledávání Pubmed.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
CZ.1.07/1.4.00/ VY_32_INOVACE_166_IT 9 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
Jak vyhledávat informace na Internetu?
WorldWideScience.gov
Podnikání na Internetu internet - zdroj informací Letní semestr 2005 Jana Holá III.
CZ.1.07/1.4.00/ VY_32_INOVACE_154_IT5 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
MIS - Manažerské informační systémy 1. cvičení – Internet a informace
Abychom neobjevovali znovu kolo!!! „Východiskem vědeckého studia musí být pečlivé prostudování existující literatury o dané otázce, abychom nezjišťovali.
Jak hledat co nejefektivněji na internetu? Referát Počítačová gramotnost II. Věra Anthová,
Nikola Dynybylová Jediný a jedinečný Sage ÚK FSS MU, Ústřední knihovna FSS MU.
REŠERŠNÍ STRATEGIE Mgr. Anna Vitásková.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
IBM - CVUT Student Research Projects Google search by voice Tomáš Losert – Karel Beyr –
INTERNET.
Základy práce s informačními zdroji pro bc. studenty SPSP Mgr. Dana Mazancová, DiS. Brno, 11. dubna 2013 Masarykova univerzita Fakulta sociálních studií.
Internet – služby Název školyGymnázium Zlín - Lesní čtvrť Číslo projektuCZ.1.07/1.5.00/ Název projektuRozvoj žákovských kompetencí.
Scholar Google Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a vzdělávání. Vyhledávání v angličtině.
Základy práce s informačními zdroji pro bc. studenty SPSP Mgr. Dana Mazancová, DiS Brno, 15. května 2014 Masarykova univerzita Fakulta sociálních studií.
Studijní informační zdroje (a jak se k nim dostat) Osnova Prezentace.
KURZ ZÁKLADY PRÁCE S POČÍTAČEM 1 Vyhledávání na internetu Autor: Mgr. Aleš Kozák.
Internet a informace MIS - Manažerské informační systémy Internet a informace Ing. Jan Luhan
Vyhledávací nástroje Internetu Mgr. Petr Šmejkal
Selekční jazyky Současné trendy Přednáška č. 5 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví.
Kurz pro doktorandy „ ELEKTRONICKÉ INFORMAČNÍ ZDROJE NA ČVUT “ Fakulta biomedicínského inženýrství Mgr. Zdeňka Civínová Ústřední knihovna ČVUT v Praze.
Vypracováno kolektivem autorů České společnosti pro technickou normalizaci Úřad pro technickou normalizaci, metrologii a státní zkušebnictví
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Internet – pojmy, služby
Vyhledávání v Internetu
Číslo projektu školy CZ.1.07/1.5.00/
Internet: vyhledávací nástroje, neviditelný web
Vyhledávání, operátory pro vyhledávání, …
vyhledávací nástroje, neviditelný web
VIKMA06 Rešeršní a studijně rozborová činnost
vyhledávací nástroje, neviditelný web
Základy práce s informačními zdroji pro bc. studenty ZUR
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Transkript prezentace:

vyhledávací nástroje, neviditelný web Internet vyhledávací nástroje, neviditelný web

Osnova vyhledávací nástroje neviditelný web trendy vyhledávací stroje metarešeršní systémy neviditelný web

Kde brát informace o existenci vyhledavačů? SearchengineWatch - http://searchenginewatch.com SearchengineShowDown - http://searchengineshowdown.com/ Katalogy, rozcestníky vyhledavačů Hotsheet – http://www.hotsheet.com/ Beaucoup - http://www.beaucoup.com/ SearchengineCollossus - http://www.searchenginecolossus.com/

žádný vyhledávací nástroj neumí prohledávat celý Internet! Vyhledávací nástroje Nástroje se orientují na atraktivitu, marketing - není poptávka po nových nástrojích a kvantitativních ukazatelích, ale pro (Google) Dříve bylo důležité zjistit o vyhledávacím nástroji: jaké způsoby vyhledávání umožňuje jakou část, službu Internetu prohledává (www, ftp…) jakým způsobem zpracovává (indexuje) www stránky rozsah, velikost databáze vyhledávacího stroje - žádný vyhledávací nástroj neumí prohledávat celý Internet!

robot SW na indexaci SW na vyhledávání

Vyhledávací nástroje jak fungují Sběr dat (roboti, crawlers) robot průběžně prochází internet většinou na principu sledování odkazu (určitého množství odkazů) - může odhalit pouze takovou stránku, na kterou vede odkaz ruční přidání (přidej odkaz, add a link, submit site, add site) http://www.google.com/addurl/?continue=/addurl http://jyxo.cz/d/submit

Vyhledávací nástroje jak fungují 2. Indexace - zapracování do vlastní databáze výpočet váhy slov z určité www v relaci s URL (sledování názvu, popisu, kw, nadpisy 1.úrovně příp. další, URL, odkaz z jiných stránek, čistý text) zpracování meta tagu description na určité stránce - popis obsahu stránky např.:<meta name="description" content="Popis tvorby a publikování WWW stránek pro začátečníky i odborníky“>. zpracování meta tagu klíčová slova na určité stránce (některé vyhledávače zcela ignorují) např.: <meta name="keywords“ content=“profesionální design,úprava textu,úprava obrázků,reklama,tvorba www">.

Vyhledávací nástroje jak fungují 3. Vyhledávání a řazení výsledků Řazení podle vztahu mezi dotazem a dokumentem (míra relevance, blízkost slov) prolinkovaný text v tagu title, systém dále vypíše obsah meta tagu description, nebo prvních několik slov ze začátku stránky, nebo kusy textu kolem hledaného výrazu Řazení podle postavení dokumentu v hypertextové struktuře webu (page rank (PR)=řazení dle relevance, věrohodnosti na principu počtu odkazů na určitou stránku (čím více odkazů na stránku, tím je PR vyšší), odkazy ze stránek s vyšším PR mají větší váhu

Trendy - Web 2.0 buzzword? - reflexe změn Goggle a jeho marketing Decentralizované služby, kooperace, agregace zdrojů (kdo vlastní data-klíčová hodnota?) – mashup nadstavby (GoogleMaps) Folksonomie x taxonomie – aktivní účast uživatelů na kategorizaci, slovním popisu (tagging) stránek Sociální vztahy, komunitní weby – blogy, wiki RSS

Nové trendy ve vyhledávání Současné vyhledávání - kvantita v pozadí metody dobývání znalostí web mining=klasifikace, shlukování predikce v nestrukturovaných textech x data mining dobývání znalostí z databází především strukturovaných informací typu tabulek ( - web intelligence kombinace interakce lidského myšlení, umělé inteligence se sítěmi a technologiemi) desktopy, toolbary - integrace vyhledávání na www s vyhledáváním v lokálních, souborech (doc, ppt, xls, pdf+další metadatové formáty), e-mailu ...

Nové trendy ve vyhledávání Intelligent Agents, Intelligent Software Agents Obecně SW, který uživateli asistuje, naviguje při práci s PC aplikacemi při čtení, filtrování, třídění, vyhledávání, správě informací za podpory umělé inteligence, znalosti uživatelských preferencí, principů fuzzy logiky, neuronové sítě a dalších pokročilých algoritmů zakomponované do vyhledávacích strojů (web spiders, web robots), aplikace competitive intelligence (zakomponované do mobilních technologií, kancelářských SW, diářů - např. ERP-Enterprise Resource Planning, telekomunikačních zařízení, e-mailu, systémů FAQ, archivů diskusních skupin) umožňují na základě předem stanovených podmínek=vestavěná znalost filtrují a vyhledávají informace na míru daného uživatele (autonomní režim) schopnost „učit se“, kooperovat, napodobovat naše již provedená rozhodnutí v nových situacích

Nové trendy ve vyhledávání filtrace e-mailu, vyhledávání diskusních skupin na základě vlastních zájmů … Projekty, odkazy Software agents group http://agents.media.mit.edu/projects/ Agent web http://agents.umbc.edu/ Intelligent Software Agents on the Internet By Björn Hermans, Using an Intelligent Agent to Enhance Search Engine Performance by James Jansen http://www.firstmonday.org/issues/issue2_3/index.html

Nové trendy ve vyhledávání Vize – sémantický web aneb na přímou otázku – přímou odpověď i komplexního charakteru (jaké je hlavní město ČR? Jaká je současná politická situace v ČR?) Předpoklad – zachycení struktury dat, problém zejména textových dokumentů značkovací jazyk html (dobrý pro zprostředkování inf. o vzhledu stránky) X xml (novými značkami umožňuje vymezit obsah pro pokročilé vyhledávací služby, specifikuje VÝZNAM tagů) ontologie - nejvyspělejší forma metadat = člověku srozumitelné a zároveň strojově zpracovatelné, - definování rozsáhlých konceptů, tématických oblastí, termínů včetně vyjádření vztahů mezi termíny x tezauru přesnější, robustnější (škála vztahů pro vyjádření blízkost, nadtřída, podtřída - (projekt ontologie WordNet cca 100 tis. termínů)

Tag clouds

Google – pokročilé vyhledávání 2 a více pojmů defaultně spojuje operátorem AND (vyhledá stránky, kde figurují všechna zadaná hesla) Star Wars Episode +I - „I“ musí být ve vyhledaných stránkách obsaženo (patří mezi takzvaná „stop slova”) “léčivé rostliny” - najde přesnou frázi cembalo OR virginal - najde stránky s minimálně jedním termínem Klaus -Santa označení „Santa“ nesmí být ve vyhledaných stránkách obsaženo „* ze Žerotína“ – hvězdička nahradí libovolné slovo ~copyright - hledá uvedený termín včetně synonymních výrazů, např. i intellectual property. (Zatím lze použít pouze pro slovní zásobu v angličtině).

Google – pokročilé vyhledávání Způsob zápisu příkaz:vyhledej (mezera) další termín operátory=příkazy, které se dají využít pro vyhledávání v Googlu http://www.google.cz/help/operators.html filetype:pdf "digitální knihovny„ - omezení jen na určitý formát dokumentu (PDF, XLS, DOC, PHP…) intitle:CPU Athlon - najde „CPU“ v názvu stránky a „Athlon“ kdekoli allintitle:idnes galerie - najde „idnes“ a „galerie“ v názvu stránky (současně) link:www.lupa.cz - najde stránky obsahující odkaz na stránky uvedeného zdroje allinanchor:Oslo - najde stránky obsahující „Oslo“ v odkazu related:http://www.zaskolou.cz - najde tématicky podobné stránky k uvedené adrese site:www.micr.cz „elektronický podpis“ – na uvedené www prohledá zdroje na téma elektronický podpis inurl:knihovna – najde uvedené slovo v URL adrese define:manuscript – najde definici pojmu stocks:IBM – najde burzovní, firemní informace o firmě info:www.muni.cz – vypíše informací o stránce (cache, odkazy na uvedenou stránku

Desktopy, toolbary

Vyhledávání „Václav Havel“ v Google Book Search Odkaz na vyhledání knihy v souborném katalogu ČR

Další vyhledavače – zajímavosti SOOPLE http://www.soople.com Přívětivější rozhraní pro googlovské vychytávky ve vyhled. – typy soubory, odkazy, definice, překlady MSN – Encarta http://www.msn.com Slovníkové vyhledávání

Další vyhledávače Yahoo - nejstarší web. adresář, od r. 2004 má vlastní fulltextový vyhledavač, vyhledávání obrázků Ask zajímavý Smart search - "capital of Nepal“, invisible tabs -např.: pictures of dna, pocket pc Alltheweb - koupil ho yahoo, možnosti pokročilého vyhledávání http://www.alltheweb.com/advanced?advanced=1& Altavista -překladač Babel fish translation http://archive.dstc.edu.au/RDU/reports/RDF-Idiot/ Exalead - zajímavá vizualizace Add shortcut – nastavení často používaných, výchozích www

Metavyhledávače Pracují s jinými vyhledávacími nástroji jedním příkazem se prohledává velké množství Internetu - dotaz je předáván k vyhodnocení rešeršním systémům (Googlu, Altavistě…) Vhodné pro vyhledávání, kde nám záleží na kvantitě, možnosti vyhledávání jsou omezené

Metavyhledávače Zapmeta (proximitní, boolovské vyhledávání, truncation, wildcard) AllTheWeb, AOL, AltaVista, and MSN http://www.zapmeta.com/help/boolean.shtml Vivísimo http://www.vivisimo.com Další produkt vivísima Clusty Jux 2 - http://www.jux2.com Ask Jeeves, Google, MSN, Yahoo Překrývání výsledků z jednotlivých vyhledávačů http://www.jux2.com/stats.php Dogpile – http://www.dogpile.com

Neviditelný web Studie Bright Planet z r. 2001- Bergman, Michael K. The Deep Web: Surfacing Hidden Value http://www.brightplanet.com/technology/deepweb.asp

Neviditelný web Problém - jak se dostat k primárním dok. na neviditelném webu? Na úrovni vstupních bodů, bran OK (HP katalogu, databázová centra) Neviditelný web mění strategie vyhledávacích strojů

Neviditelný web - vstupní brány SCIRUS http://www.scirus.com/srsapp/ Přes 200 mil.vědeckých www Specifický vyhledávací nástroj pro odborné informace (záměrná filtrace nevědeckých obsahů, hluboká indexace www, vědeckých databází) Náměty na vyhledávání http://www.scirus.com/srsapp/tips/

Vyhledávače neviditelného webu Complete Planet – katalog prohledatelných databází http://aip.completeplanet.com Registruje přes 40 000 zdrojů, obsažených v 7000 kategoriích strukturovaného hesláře Direct Search – přímé vyhledávání, tématicky dělený rozcestník k prohledatelným databázím http://www.freepint.com/gary/direct.htm

Vyhledávače neviditelného webu TURBO 10 http://turbo10.com/ Zajímavá vizualizace, clustrování zdrojí podle kategorií, vládní, univerzitní, obchodní online zdroje, databáze Invisible web http://www.invisible-web.net/

Kliknutím si prohlédnu uvedený odkaz

SCIRUS Kliknutím na specifické heslo se jednoduše přidá další klíčové slovo do dotazu, a tak se zpřesní vyhledávání.

Ověřování informací na internetu, výsledků vyhledávání vyhledávání JAK VYBRAT A NEPŘEBRAT? kritické hodnocení vyhledaných výsledků Kritéria: relevance - věcná shoda vyhledané informace s dotazem uživatele úplnost přesnost, důvěryhodnost (jasné autorství, jazyk textu, citovaná literatura, objektivita, podložená argumentace, typ dokumentu, práce-vědecký text či reklama, umístění adresy, doména, datace, uvedení důvodů pro zveřejnění….) ověření v referenčních zdrojích

Ověřování informací na internetu, výsledků vyhledávání vyhledávání zlomyslné žerty – HOAX - http://www.hoax.cz/ „seriózní“ bludy a mystifikace http://www.bonsaikitten.com/gray.html zaujaté, neobjektivní „seriózní“ informace http://www.martinlutherking.org/

Ověřování informací na internetu, výsledků vyhledávání vyhledávání IFCC – Internet Fraud Complaint Centrum – partnerská instituce FBI, shromažďuje informace na podvodné služby a zdroje na internetu, registr stížností + zveřejnění aktuálních hrozeb http://www.ifccfbi.gov/ FRAUD.org – národní informační centrum, které monitoruje podvody na internetu http://www.fraud.org/internet/inttip/inttip.htm