VYHLEDÁVÁNÍ A SHROMAŽĎOVÁNÍ INFORMACÍ
VYHLEDÁVÁNÍ INFORMACÍ KDE hledat JAK hledat ELEKTRONICKÉ informační zdroje vyhledávací nástroje na INTERNETU
KDE HLEDAT
KDE HLEDAT - POJMY Informační pramen (IP) - množina dat či informací, zaznamenána na "nosiči informací„ (ve formě hmotné, např. kniha; nehmotné, např. projev, rozhlasové vysílání). Dokument – hmotný nosič informací (kniha, periodikum atd.). Primární IP – informační zdroj, přináší vlastní, většinou i původní, informace nebo data – přímé informace (celé texty knihy, článku apod.) Sekundární IP – informuje o existenci primárních IP, nejde o souvislé texty knih, časopisů apod., ale pouze o odkazy (nepřímé informace) na ně. Terciální IP - informuje o existenci sekundárních IP.
KDE HLEDAT - DĚLENÍ IP Podle nosiče jsou dokumenty : tištěné elektronické na hmotném nosiči (diskety, CD-ROM, DVD) síťové (online, offline) mikrografické (mikrofilmy, mikrofiše → pro archivní účely) K prohlížení elektronických a mikrografických potřeba nějaké přístroje (počítač, čtečka, videorekordér aj.). Podle původnosti obsahu: primární sekundární terciální
1. 1 TIŠTĚNÉ PRIMÁRNÍ PRAMENY Písemné dokumenty Kniha = duševní dílo tvořící myšlenkový a výtvarný celek, neperiodicky, jednorázově, má knihařskou úpravu a ISBN, v tištěné nebo elektronické podobě Monografie Učebnice Skripta Příručky encyklopedie slovníky klíče, průvodce, adresáře, tabulky, návod, atlasy, ... Sborníky
1. 1 TIŠTĚNÉ PRIMÁRNÍ PRAMENY Periodické dokumenty - v intervalu jednoho dne až půl roku, nepravá periodika (např. 1x za 5 let), jednotná úprava, jednotné obsahové zaměření Noviny Časopisy Periodické sborníky Ročenky
1. 1 TIŠTĚNÉ PRIMÁRNÍ PRAMENY Speciální dokumenty - nevychází běžnou formou, nepublikované patentové dokumenty normativní dokumenty technické normy právní normy firemní literatura vědecko-kvalifikační práce materiály z konferencí výzkumné zprávy legislativní dokumenty separáty
1. 2 OBRAZOVÉ PRIMÁRNÍ PRAMENY Grafika Mapy, atlasy Plány Fotografické dokumenty Výkresy Schémata, diagramy a ilustrace = součásti písemných dokumentů
1. DALŠÍ PRIMÁRNÍ PRAMENY 1. 3 ZVUKOVÉ PRIMÁRNÍ PRAMENY - zvukový projev 1. 4 AUDIOVIZUÁLNÍ PRIMÁRNÍ PRAMENY - současně obraz i zvuk
2. SEKUNDÁRNÍ PRAMENY katalogy knihoven - lístkové, elektronické, souborné bibliografie referátové časopisy bibliografické (dokumentografické) databáze Current Contents nakladatelské katalogy
2. 1 KATALOGY KNIHOVEN = soubor záznamů o existenci primárních pramenů Dělení klasických lístkových katalogů : jmenné/autorské názvové předmětové systematické Elektronický katalog – veřejně dostupný online katalog: katalog jedné knihovny souborný katalog více knihoven
2. DALŠÍ SEKUNDÁRNÍ PRAMENY 2. 2 BIBLIOGRAFIE = seznam dokumentů na určité téma zpracovaný podle určitých zásad, pravidel a hledisek, např. Česká národní bibliografie http://aip.nkp.cz 2. 3 REFERÁTOVÝ ČASOPIS = bibliografické periodikum (referátové agentury), o dokumentech s referáty nebo s referujícími anotacemi z vymezené oblasti vědy nebo techniky 2. 4 CURRENT CONTENTS (obsahové periodikum) = seriálový dokument reprodukující obsahy nejnovějších čísel významných vědeckých časopisů z určité oblasti nebo oboru, cíl - informovat o aktuální článkové odborné literatuře. např. databáze Web of Knowledge
2. DALŠÍ SEKUNDÁRNÍ PRAMENY 2. 5 NAKLADATELSKÉ KATALOGY (vydavatelský katalog, ediční výhled) = vydává nakladatel - informovat odbornou i laickou veřejnost o náplni své vydavatelské činnosti pro nastávajícím časové období (obvykle rok) Ediční plán - o vydaných a dostupných nebo k vydání připravovaných titulech nakladatelství, např. Grada http://www.grada.cz
2. DALŠÍ SEKUNDÁRNÍ PRAMENY 2. 6 BIBLIOGRAFICKÁ DATABÁZE = datovou základnu tvoří bibliografické informace vymezené obsahově, typem popisovaných zdrojů nebo jejich lokací - k vyhledávání bibliografických informací, např. časopisecká databáze Ulrich´s http://www.ulrichsweb.com/ulrichsweb Základní typy: elektronické katalogy knihoven a archivů oborové databáze zpřístupňované databázovými centry seznamy zdrojů internetu
3. TERCIÁLNÍ PRAMENY - neobsahují přímé informace, ale zaznamenávají údaje o existenci sekundárních pramenů Příklad: • Bibliografie bibliografií - bibliografie obsahující záznamy publikovaných bibliografií, která slouží jako referenční zdroj. • Databáze databází - databáze obsahující záznamy o existujících databázích, např. Gale Directory of Databases.
KDE HLEDAT knihovna archiv, muzeum, galerie, informační instituce (centrum, středisko) databázové centrum (= virtuální instituce s celosvětovým obchodním pokrytím; nabízí, produkují, zprostředkovávají přístup k odborným a obchodním databázím) informační specialista (= odborný pracovník zaměřený ve své informační činnosti na specifický obor), informační broker (= osoby, které se zabývají zprostředkováním a prodejem informačních produktů a služeb) meziknihovní výpůjční služba (MVS) služba dodávání dokumentů (DDS)
KDE HLEDAT - KNIHOVNY Systém knihoven ČR jmenované v zákoně tvoří: Národní knihovna ČR Knihovna a tiskárna pro nevidomé K. E. Macana Moravská zemská knihovna krajské knihovny (zřizované orgánem kraje) základní knihovny (zřizované orgánem obce - veřejné knihovny obecní, městské) specializované knihovny (zaměřené na jednotlivé obory lidského vědění – technické, lékařské, právnické, pedagogické, zemědělské, potravinářské, muzejní atd., knihovny Akademie věd ČR).
KDE HLEDAT - KNIHOVNY Druhy knihoven podle uživatele: univerzitní, vysokoškolské, školní ústřední odborné specializované vědecké veřejné soukromé.
JAK HLEDAT
JAK HLEDAT INFORMACE rešerše = soupis bibliografických záznamů, faktografických záznamů nebo plných textů dokumentů, které odpovídají požadavku uživatele Vyhledávání informací jako proces probíhá v následujících fázích/krocích: formulace a analýza rešeršního požadavku výběr vhodného zdroje pro vyhledávání informací kombinace selekčních termínů vlastní vyhledávání zjemňování a ladění rešeršního dotazu
JAK HLEDAT INFORMACE formulace rešeršního požadavku → identifikace klíčových slov – pravidla: ne tzv. stopslova (např. předložky, spojky) podstatná jména - těžištěm vyhledávání modifikátory (přísudky, přídavná jména), slovesa –víceznačnost a zaměnitelnost, lépe nezahrnovat, výjimkou ty sloužící k jednoznačné identifikaci (např. míšeňský porcelán, Pythagorova věta) Příklad: Ovlivňuje informační výchova vysokoškolských studentů jejich způsobilost pracovat s informačními zdroji?
VZTAHY MEZI POJMY - booleovské (logické) operátory - vyjadřují logické vztahy mezi pojmy, nejpoužívanější: AND OR NOT
1. REŠERŠNÍ STRATEGIE Strategie stavebních kamenů - dotaz z více samostatných dílčích dotazů (kamenů), úplný požadavek na vyhledávání. Dílčí dotazy se spojí do výsledného pomocí AND: („informační výchova“ OR „informační vzdělávání“ OR „informační gramotnost“) AND („vysokoškolský student“ OR „univerzitní posluchač“ OR „student“)
2. REŠERŠNÍ STRATEGIE Strategie rostoucí perly – podle nejužšího pojmu z rešeršního požadavku nebo podle nejspecifičtějších termínů k jednotlivým pojmům. Například z množiny vysokoškolský student, univerzitní posluchač, student bychom použili to první. Cílem - vyhledání alespoň 1 záznamu pro zjištění použitých popisných údajů (např. autora, klíčových slov) v záznamu katalogu/databáze, ty využít pro následnou úpravu formulace rešeršního dotazu podle zjištěných termínů. - vhodná zejména pro vyhledávání záznamů v elektronických katalozích a databázích (např. Robert Sternberg)
3. REŠERŠNÍ STRATEGIE Strategie osekávání – opakem předchozí, formulován široce a je postupně zužován. Cílem - vyhledání více záznamů/dokumentů. K širší formulaci dotazu nejsou využívány specifické/užší pojmy, ale naopak pojmy širokého záběru - např. vědní obory a jednotlivé disciplíny (národnostní a etnické menšiny).
ELEKTRONICKÉ INFORMAČNÍ ZDROJE
ELEKTRONICKÉ INFORMAČNÍ ZDROJE EIZ = informační zdroje uchovávané v elektronické podobě a dostupné v prostředí počítačových sítí nebo prostřednictvím jiných technologií distribuce digitálních dat (např. na discích CD-ROM, DVD), primární × sekundární Dělení: z hlediska typů: online katalogy = elektronické katalogy knihoven databáze (profesionálních informací) oborové portály digitální knihovny, e-knihy, e-časopisy
ELEKTRONICKÉ INFORMAČNÍ ZDROJE z hlediska technického zpřístupnění: přístup k EIZ offline (komunikace probíhá v dávkovém režimu) přístup k EIZ online (komunikace probíhá v reálném čase, interaktivně) z hlediska tématického a oborového dělení (zdroje zaměřené na konkrétní obor nebo multioborové) z hlediska standardů, které souvisí s internetem a digitálními informacemi (např. na http://dublincore.org/documents/dcmi-type-vocabulary/)
PŘEDEM SI ROZMYSLET CO - co chci najít (téma, klíčová slova, časové vymezení, jazyk, geografické omezení, zdroje, kde chci hledat) KDE - výběr zdrojů (primární × sekundární) např. elektronické katalogy (pedagogických) knihoven v ČR, české a zahraniční bibliografické článkové databáze, zahraniční plnotextové článkové databáze JAK - naformulování dotazu a vyhledávací strategie (booleovské a proximitní = distanční operátory, symboly pro zkracování a nahrazování, např. ?, *; #)
SPOLEČNÉ ZNAKY EIZ Ve velkém měřítku nikdo nenabízí takový zdroj, který na přímou otázku dá přímou odpověď (musíme přes formulaci klíčových slov a jejich zobrazení ve výsledcích vyhledávání hledat odpovědi sami). I když se EIZ liší, většinou všechny nabízejí: jednoduché vyhledávání (zápis klíčových slov do vyhledávacího okénka) pokročilé vyhledávání (kombinace klíčových slov, frází, využití specifických vyhledávacích nástrojů) prohlížení nebo listování rejstříky, indexy...
1. ELEKTRONICKÉ KNIHOVNÍ KATALOGY Bibliografické údaje - popisné údaje (např.: autor, název, nakladatelské údaje, údaje o rozsahu, mezinárodní standardní číslo). Bibliografický záznam - soubor údajů, které fyzicky a obsahově popisují dokumenty, je v sekundárních IP, v případě knihovních katalogů obsahuje i lokační údaje ale ne plné texty, obsah konkrétního dokumentu je vyjádřen klíčovými slovy, předmětovými hesly, příp. anotací. V každém online katalogu můžeme listovat (prohlížet) nebo přímo vyhledávat.
2. DATABÁZE = „organizovaná, strukturovaná sbírka informací“ (např. Zlaté stránky), princip strukturace, řazení, vyhledávání aj. odborných informací vyhledávat podle různých polí (hledisek) stejně jako v online katalogu popř. hlediska kombinovat nevztahují se ke konkrétní knihovně nebo instituci a jejich literatuře ALE obsahují citace a texty renomovaných odborných knižních vydavatelů a časopiseckých titulů profesionální databáze = placené licencované zboží na nadnárodní úrovni (garance kvality, věrohodnosti obsahu) seznam na MU najdete na portálu Elektronické informační zdroje MU http://library.muni.cz/ezdroje/
2. DATABÁZE - DRUHY plnotextové (full-textové) – kompletní, celé texty nejčastěji článků, např. Proquest, EIFL-Direct, Science Direct, JSTOR bibliografické – pouze citace, odkazové informace o vydaných titulech knih, časopisů, článků (většinou s abstrakty), např. Medline, Web of Science, Ulrich’s Periodical Directory faktografické - numerická data, statistiky, adresáře obrazové – zpřístupňují obrazové soubory, fotografie… audio, video, multimediální – zvukové nahrávky smíšené – kombinace výše uvedených druhů
3. PORTÁLY, BRÁNY Práci s věrohodnými, ověřenými oborovými zdroji mohou usnadnit navigační rozcestníky neboli portály, oborové informační brány. např. Portál STM - průvodce informačními zdroji v oblasti STM (Science, Technology, Medicine) na http://www.portalstm.cz/ Jednotná informační brána - http://www.jib.cz/ - zpřístupňuje pod jedním odkazem různorodé druhy informací, přes JIB lze využívat různé české a zahraniční zdroje (katalogy knihoven, souborné katalogy, plnotextové databáze atd.) JIB se snaží řešit roztříštěnost zdrojů na různých URL adresách a pokaždé odlišné navigační a vyhledávací prvky → popis a rady na vyhledávání na http://info.jib.cz/
4. DIGITÁLNI KNIHOVNY, E-ČASOPISY, E-KNIHY digitální knihovna = komplexní sbírka digitálních objektů např. plných textů knih, časopisů, obrazových, zvukových, audiovizuálních nebo multimediálních objektů systematická správa, popis, vyhledávání z jednoho místa v různorodých zdrojích zaměření na kvalitu, systematické budování určité kolekce, sbírky nonstop přístup ke sbírkám, efektivní vyhledávání, sdílení dat portál Elektronické informační zdroje MU http://library.muni.cz/ezdroje/ - tyto zdroje zde zařazeny mezi fulltextové zdroje, např. kolekce el. knih od nakladatelství Gale, el. knihovna knih a časopisů nakladatelství Wiley (InterScience) + vlevo El. časopisy
VYHLEDÁVACÍ NÁSTROJE NA INTERNETU
VYHLEDÁVÁNÍ INFORMACÍ NA INTERNETU informační zdroje dostupné přímo informační zdroje přístupné zprostředkovaně Vyhledávací služby z funkčního hlediska: vyhledávací stroje – indexují slova nebo termíny, které se vyskytují ve WWW dokumentech, předmětové katalogy – klasifikují dokumenty nebo celé servery podle dané předmětové klasifikace či taxonomie
1. VYHLEDÁVACÍ STROJE - k lokalizaci informací na internetu - na základě klíčového slova naformulovaného uživatelem hledá v databázi nebo v indexu, uživateli poté oznámí výsledek hledání - klíčové slovo (keyword) - jednotlivé slovo, část slova nebo frázi, volba správných klíčových slov je základ úspěchu;-) - z 1 nebo více klíčových slov složen dotaz (query) reprezentující úplný vyhledávací požadavek, uplatňují se operátory - dokument vyhovující zadanému dotazu = hit, úspěšný dotaz vede k 1 nebo více hitům
1. VYHLEDÁVACÍ STROJE K vyhledávacím strojům patří např.: Google – www.google.com (popř. http://www.soople.com) AltaVista – www.av.com Excite – www.excite.com Lycos – www.lycos.com Pro Českou republiku: Jyxo – http://jyxo.cz Morfeo – http://morfeo.centrum.cz
1. VYHLEDÁVACÍ STROJE Kdy použijeme služeb vyhledávacího stroje: • v případě, že předmět našeho zájmu je příliš úzký, nebo že obsahuje neobvyklé termíny, • v případě, že hledáme zvláštní sídlo, • v případě, že chceme vyhledávat v milionech stránkách, • když chceme vyhledat velký počet stránek k určitému předmětu zkoumání, • když chceme vyhledávat určité typy dokumentů, souborů, jazyků, nastavit filtr na datum modifikace apod., • když chceme použít takové výhody, jakými jsou např. pojmové shlukování, řazení dokumentů podle popularity apod.
1. VYHLEDÁVACÍ STROJE Problémy: různé vyhledávací stroje různé syntaxe příkazů (nedostatek standardizace) databáze vyhledávacích strojů se vytváří automaticky prostřednictvím robotů → mnoho stránek pochybné kvality problém neviditelného webu - příčinou je, že vyhledávací stroje nedokáží indexovat dynamicky se měnící stránky, některé vyhledávací stroje neindexují rámce, obrázkové mapy apod., přístup na některé stránky je chráněný heslem, mnoho vyhledávacích strojů má omezení na počet indexovaných stránek z určité domény atd.
2. PŘEDMĚTOVÉ ADRESÁŘE A KATALOGY Při kategorizaci vyhledávacích služeb již nelze striktně dělit - v současnosti hybridní stroje (adresář zároveň funkce na vyhledávání a vyhledávací stroj obsahuje i adresář), rozdíl v tom, co bylo primární funkcí vyhledávací služby. - pokrývá menší část webového prostoru, výhodou přísná hierarchická klasifikace a celá řada dalších kategorií a podkategorií podle typu a velikosti adresáře - uživatel, který používá předmětový adresář ví, co hledá a ví do které předmětové kategorie hledaná informace patří - služba nabízející spojení na internetové zdroje, které dodali buď tvůrci webových stránek a nebo informační pracovníci
2. PŘEDMĚTOVÉ ADRESÁŘE A KATALOGY Kdy použijeme služeb předmětového katalogu: v případě, že jde o široký okruh tématu, když chceme získat seznam webových sídel, když hledáme informace o firmě, když vyhledáváme výrobky, když hledáme nejnovější zprávy, když hledáme podle titulu webového sídla, když se chceme vyhnout dokumentům s nízkým obsahem, které často vracejí vyhledávací stroje apod. Výhoda - záruka kvality, která je de facto dána způsobem údržby (výhradně ručně) katalogů. Většina adresářů informační zdroje hodnotí a anotuje.
2. PŘEDMĚTOVÉ ADRESÁŘE A KATALOGY Předmětové katalogy s celosvětovou působností: Yahoo! (Yet Another Hierarchical Officious Oracle) – http://www.yahoo.com LookSmart - http://www.looksmart.com Open Directory Project – www.dmoz.org Česká republika - regionálně vymezené katalogy: Seznam – http://www.seznam.cz Centrum – www.centrum.cz
VYHLEDÁVÁNÍ INFORMACÍ NA INTERNETU Pro efektivní vyhledávání na internetu desítky vyhledávacích nástrojů - souhrnné rozcestníky, adresáře vyhledávacích nástrojů → zorientovat, který z nástrojů použít. Příklad adresáře: Beaucoup - http://www.beaucoup.com SearchengineCollossus - http://www.searchenginecolossus.com Specializované zdroje sumarizující ve srovnávacích studiích informace o vyhledávacích strojích, např: SearchengineWatch - http://searchenginewatch.com SearchengineShowDown - http://searchengineshowdown.com Top SearchEngines http://topsearchengines.info
INTERNET - HODNOCENÍ INFORMACÍ - problém, jak oddělit zrno od plev, Internet = svobodný prostor, kde kdokoli o čemkoli, žádný cenzor obsahů, informace žijí vlastním životem a nikdo je neaktualizuje. → kritickým pohledem posuzovat výsledky (ani sofistikované vyhledávací stroje nehodnotí obsahovou kvalitu nalezených www stránek) - každý od výsledků vyhledávání něco jiného - co se nelíbí jednomu, druhý považuje za přínosné, evaluace informací vždy subjektivní, ale některá obecná kriteria pro nás mohou být užitečným vodítkem při hodnocení výsledků vyhledávání na internetu
INTERNET - HODNOCENÍ INFORMACÍ Kritéria hodnocení: • kritérium - jasný účel textu (práce-vědecký text či reklama), cílový uživatel, uvedení důvodů pro zveřejnění • kriterium úplnosti, přesnosti, důvěryhodnosti, objektivita, podložená argumentace u odborných textů • kritérium - jasné autorství • jazyk textu, stylistika • umístění adresy, doména může napovědět více o autorovi, příp. instituci • u článků, odborných statí by měla být uvedená citovaná literatura, odkazy • datum zveřejnění, aktualizace • možnost ověření v referenčních zdrojích
HODNOCENÍ INFORMACÍ Kontrolní desatero: 1. Kdo je autorem obsahu? 2. Jakou má autor kvalifikaci, odbornou erudovanost ve vztahu k popisovaném tématu? 3. Jsou prezentované informace přesné, objektivní, přiměřené? 4. Je www stránka po obsahové stránce srovnatelná s jinými stránkami zabývajícími se podobným tématem? 5. Obsahuje www stránka nové, originální myšlenky, informace k tématu a jsou tyto informace podložené objektivními argumenty? 6. Odpovídá styl jazyka zamýšlenému cílovému publiku? 7. Můžeme zjistit reference, odkazy na www stránku nebo autora informací? 8. Můžeme zjistit datum publikování a poslední aktualizace www stránky? 9. Obsahuje www stránka funkční linky, odkazy? 10. Je www stránka pro navigaci přehledná a případné obrázky, videa, zvuky mají opodstatněnou funkci na stránce?
POUŽITÉ ZDROJE Studijní opory č. 2 až 8. In Kurz práce s informacemi. Brno: MU, 2007.