Zpracování informací a znalostí Informační a citační analýza Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství
Informační a citační analýza Cíle a metody Bradfordův a Zipfův zákon Hodnocení časopisů Citační rejstříky Poznámka – page rank
Informační analýza Získávání informací analýzou formálních bibliografických údajů (nejedná se o vyhodnocování obsahu).
Informační analýza – jednotka zpracování Bibliografický záznam údaje o autorech název dokumentu, charakteristika obsahu, nakladatelství vydání (pořadí, datum,...) rozsah ISBN, ISSN ... citace
Příklad bibliografického záznamu v Národní knihovně
Příklad bibliografického záznamu v Národní knihovně
Příklad záznamu v systému ProQuest
Informační analýza – základní metody Frekvenční analýza – zjišťují se četnosti výskytu různých údajů v souboru záznamů Citační analýza – zjišťují se návaznosti mezi záznamy v souboru
Citační analýza které prameny jsou v dokumentu citovány ve kterých dokumentech je pramen citován které dokumenty jsou citovány hodně / málo které citace se objevují často spolu kteří autoři se objevují často spolu či se navzájem citují které prameny jsou klíčové pro určitý obor / téma
Bibliometrie Cílem bibliometrie je osvětlit proces psané komunikace a i zaměření vědecké discipliny (do té míry, jak se odráží v psané komunikaci) pomocí kvantitativní analýzy rozličných složek psané komunikace. Literatura: KÖNIGOVÁ, M.: Úvod do bibliometrie. Praha, Česká informační společnost, 1993, 74 s.
Cíle informačních analýz Sledování úrovně a trendů rozvoje (obory, země, regiony, ...) Hodnocení výsledků a přínosu vědy (obory, kolektivy) Profilování a optimalizace informačních fondů vytipování nejvhodnějších zdrojů informací inovace fondu vzhledem k rozvoji oboru vytipování a odstranění zbytečných zdrojů informací rozbory spokojenosti uživatelů
Informační a citační analýza Cíle a metody Bradfordův a Zipfův zákon Hodnocení časopisů Citační rejstříky Poznámka – page rank
Bradfordův zákon (1) Bradfordovo rozdělení se týká rozložení článků k dané tématice v časopisech. Křivka vyjadřující závislost celkového počtu článků na logaritmu počtu časopisů, ve kterých se tyto články vyskytují, má charakteristický tvar, nezávislý na tématice článků.
Bradfordův zákon (2) Všechny články lze rozdělit na jádro a dvě zóny tak, že jádro i každá zóna obsahují přibližně třetinu ze všech článků. Články z jádra jsou publikovány v časopisech věnujících se dané tématice. Články z první zóny jsou publikovány v n-krát větším počtu průřezových časopisů a časopisů hraničních oborů. Články z druhé zóny jsou rozptýleny v přibližně n2 – krát větším počtu časopisů než má jádro.
Zipfův zákon Týká se závislosti frekvence slov a pořadí slov v textu podle frekvence Fs ... frekvence slova S v textu Rs ... pořadí slova S podle frekvence Zipfův zákon: Fs * Rs = konstanta (přibližně)
Informační a citační analýza Cíle a metody Bradfordův a Zipfův zákon Hodnocení časopisů Citační rejstříky Poznámka – page rank
DOPAD (sociální viditelnost) Hodnocení časopisů (1) DOPAD (sociální viditelnost) počet ročníků rozsah (počet článků za rok) náklad počet předplatitelů …
Hodnocení časopisů (2) KVALITA Impact faktor (faktor vlivu), viz též http://www.vse.cz/obecne/impactfk.php3 Další kriteria, viz např. bod 4 na http://www.vse.cz/impakt-faktor/impakt-priklady.php
Hodnocení časopisů FAKTOR VLIVU (Impact factor, IF) průměrný počet citací jinde na články vyšlé v časopise v předcházejících dvou letech Příklad: Impakt faktor časopisu za rok 2007 = počet citací zveřejněných v roce 2007 na články vydané v letech 2005 a 2006 počet všech článků vyšlých v časopise v letech 2005 a 2006
Impact factor – ISI Web of Knowledge
Informační a citační analýza Cíle a metody Bradfordův a Zipfův zákon Hodnocení časopisů Citační rejstříky Poznámka – page rank
Citační rejstříky Příklad problému Google – Scholar Web of Knowledge Science Citation Index Social Sciences Citation Index Art & Humanities Citation Index Scopus Citeseer DBLP
Citační rejstříky – příklad problému Zajímá nás článek CHEN H.: Knowledge based document retrieval: Framework and design. Journal of Information Science, 18, 1992 s. 293 - 314. Elsevier Viz skripta: Rauch, J.: Metody zpracování informací II (kapitola 12, Znalostní systém METACAT pro vyhledávání dokumentů) ??? KDO CITOVAL ???
Google – Scholar, příklad použití http://scholar.google.com http://scholar.google.com/advanced_scholar_search?hl=en&lr=
Google – Scholar, příklad použití
Google – Scholar, příklad použití
Google – Scholar, příklad použití
Google – Scholar, příklad použití
Google – Scholar, příklad použití
Web of Knowledge
Web of Knowledge
Web of Knowledge
Web of Knowledge
Web of Knowledge
Web of Knowledge
Web of Knowledge
Web of Science – related records Článek 1 ….. Literatura: [1] A …. [2] PG … [3] U … [4] UJ … [5] C … [6] PR … [7] KO … [8] SD … [9] AD … Článek 2 ….. Literatura: [1] A …. [2] GH … [3] WX … [4] C … [5] L … [6] KO … [7] JK … [8] IP … [9] AD … Citují společné prameny
Related records – příklad Článek 1 Článek 2
Citační rejstříky - Scopus http://www.vse.cz/zdroje/vypis.php?ID_zdroje=90 http://www.scopus.com/scopus/home.url
Citační rejstříky - Citeseer http://citeseer.ist.psu.edu/
Citační rejstříky - DBLP http://www.informatik.uni-trier.de/~ley/db/
Informační a citační analýza Cíle a metody Bradfordův a Zipfův zákon Hodnocení časopisů Citační rejstříky Poznámka – page rank
Poznámka: page rank http://pagerank.suchmaschinen-doktor.de/index.html
Poznámka: page rank http://pagerank.suchmaschinen-doktor.de/index/examples.html
Poznámka: page rank http://ilps.science.uva.nl/Teaching/II0607/twiki/pub/Main/CourseSchedule/ii0607-week-05-01-8up.pdf