BIBLIOMETRIE PRO MĚŘENÍ KVALITY INFORMACÍ J. Potomková Knihovna LF UP v Olomouci potomkov@tunw.upol.cz Programové vybavení ordinace zubního lékaře
Definice bibliometrie Bibliometrie je vědní disciplína, založená na kvantitativní analýze a měření dokumentů určených na zaznamenání a komunikaci vědeckých poznatků. Bibliometrické metody vycházejí z předpokladu, že dokumenty jsou odrazem stavu vědeckého poznání, myšlení a komunikace znalostí.
BIBLIOMETRIE a příbuzné vědní obory Infometrie kvantitativní a kvalitativní hodnoty informací získané z různých komunikačních médií Scientometrie zákonitosti vědecké produktivity a její výsledná prospěšnost Kybermetrie funkce a efektivita počítačových systémů a internetového prostoru.
Historie bibliometrie 1917 - F.J.Cole a N.B. Eales publikovali práci pro výzkum oboru anatomie “Statistická analýza literatury”. Snažili se dokázat vývoj zájmu o tento obor v jednotlivých zemích pomocí metod statistického rozložení. 1923 - Knihovník britského patentového úřadu E. W. Hume vytvořil statistickou analýzu vývoje vědy. Vycházel z bibliografických záznamů v časopisech ze 17 sekcí Mezinárodního katalogu vědecké literatury. 1927 - Vznikla první analýza citací. Její autoři P.L.K.Gross a E.M.Gross spočítali a analyzovali citace článků v chemických časopisech. Poté nastal prudký nárůst aplikování citační analýzy.
Bibliometrické zákony
Bibliometrické zákony Zákonitosti růstu, rozptylu a stárnutí publikací. Bradfordův - rozptyl informací Lotkův - měření autorské produktivity Zipfův – lingvistická frekvenční analýza, indexace a vyhledávání v Internetu
Bradfordův zákon ZÁKON ROZPTYLU INFORMACÍ S. C. Bradford - americký knihovník, jeden ze zakladatelů bibliometrie zkoumal rozptyl relevantních článků v časopisech vůči konkrétnímu oboru maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro oboru. vědecké časopisy je možno rozdělit podle klesající produktivity článků o daném tématu takto: jádro – články výhradně o příslušném tématu zóny, které mají stejný počet článků jako jádro Počet časopisů v jádru a sestupných zónách je v poměru 1:n:n2 Zákon byl formulován 1934 při řešení rešeršního problému v oblasti geofyziky. Samuel Clemens Bradford (1878 - 1948)
Bradfordův zákon Algoritmus Všechny články lze rozdělit na jádro a 2 zóny jádro i každá zóna obsahují přibližně 1/3 všech článků. články z jádra jsou publikovány v časopisech, specializovaných na danou tématiku články 1. zóny jsou publikovány v n-krát větším počtu průřezových časopisů a časopisů hraničních oborů. články z 2. zóny jsou rozptýleny v přibližně n2 časopisech.
Bradfordův zákon Jak to zjistil? Bibliografie z oboru geofyziky 326 časopisů 9 časopisů = 429 článků 59 časopisů = 499 článků 258 časopisů = 404 článků Použití v knihovnách při tvorbě časopiseckých fondů
Bradfordův zákon – příklad: Celkový počet článků = 690 Počet titulů časopisů = 26 Jádro = 2 (23O) Zóna1 = 6 (230) Zóna2 = 18 (230) Algoritmus: 1:n:n2 1 : 3 : 9 n=3 (číslo získáme vydělením počtu titulů v 1. zóně počtem titulů obsažených v jádru)
Lotkův zákon MĚŘENÍ VĚDECKÉ PRODUKTIVITY A. Lotka (1880 – 1949), americký matematik, fyzikální chemik a statistik oblast fyziky a chemie produktivita autorů - rozložení autorů podle produkce 1926 - srovnávání publikační činnosti chemiků a fyziků pokud a1 autorů publikuje jeden článek, pak an bude počet autorů, kteří publikují n článků. an = a1 / n2 podle Lotky můžeme předem stanovit, kolik autorů publikuje více článků v případě, že známe počet autorů, kteří publikovali 1 článek v dané tématické oblasti. počet autorů s n tituly (např. knihami, články) činí cca 1/n2 z počtu těch, kteří jsou autory pouze 1 titulu. podíl autorů pouze 1 titulu je cca 60%, podíl autorů většího počtu titulů exponenciálně klesá. na každých 100 autorů/1 článek připadá 25 autorů/2 články 11 autorů/3 články 6 autorů/4 články Alfred James Lotka (March 2, 1880 - December 5, 1949) * v Rakouskouhersku LVOV
Aplikace Lotkova zákona Objektivní kritéria hodnocení pracovníků a pracovišť akademických institucí. Publikace Masarykovy univerzity 1994 – 2004 4179 autorů 70 936 publikací Jaký počet autorů napsalo kolik publikací
Zipfův zákon FREKVENČNÍ ANALÝZA, LINGVISTICKÁ STATISTIKA G.K. Zipf (1902-1950) americký filolog a statistik, profesor lingvistiky na Harvardské univerzitě Slova uspořádal podle frekvence ( f ) výskytu a slovo s hodnotou nejvyššího výskytu dostalo „rank 1 ( r =1), další slovo „rank 2“ atd. Zipfův zákon vyjadřuje skutečnost, že základ lexiky (slovní zásoby) vytváří relativně malý počet silně frekventovaných slov Jsou-li slova delšího textu seřazena podle pořadí klesající četnosti výskytu, potom součin pořadí ( r ) a četnosti ( f ) pro každé slovo v textu bude přibližně = konstanta ( C ), která závisí na délce textu. r x f = c Na základě Zipfova zákona se konstruovaly slovníky rešeršních slov a nevýznamových (stop) slov, které jsou základem pro automatické vyhledávání a uspořádání výsledků podle relevance. Využití při koncipování základních funkcí Internetu včetně rozvoje vyhledávacích služeb. věnoval se kvantitativní analýze jazyka své výzkumy publikoval v knize z r. 1945 “The Human Behavior and the Principle of Least Effort”. předmětem jeho výzkumů byla kniha Odyseus autora J. Joyce. Zipf zjistil, že v knize je 29,899 různých slov. Tato – šlo o rozptyl slov v textu, statistického rozložení
Povrchový a hluboký web Povrchový web volně přístupný pro vyhledávací stroje obsahuje cca 1 miliardu webových stránek Hluboký web nepřístupný pro vyhledávací stroje dokumenty profesionálních databází 500x obsáhlejší než povrchový 550 miliard dokumentů 7 500 terabytů informací 100 000 webových sídel (www.completeplanet.com) 60 největších sídel obsahuje cca 750 terabytů informací nejrychleji rostoucí webová kategorie s novými informacemi kvalita obsahu (pode jeho autorů) 1000- až 2000-x vyšší.
Kybermetrie hlubokého webu 1 Scirus http://www.scirus.com 2001 firma Elsevier Science Vyčlenění informací relevantních pro vědu, výzkum a vzdělávání Ocenění WebAward 2004 Pokrytí cca 167 milionů webových stránek univerzit, vědeckých, výzkumných a vládních organizací, odborných společností, konferencí aj. Používá pokročilé vyhledávání a operátory Uveřejňuje své zdroje Možnost porovnání výsledků s Googlem
Kybermetrie hlubokého webu 2 Google Scholar http://www.scholar.google.com Vyhledávání vědeckých textů Citační ohlasy („Cited by“) Indexace dokumenty ze všech významných databázových center kromě Elsevier Science volně přístupné archivy s garantovaným obsahem, „Pagerank“ – vyhodnocení relevance vyhledaných dokumentů Vydavatelé, agregátoři, profesních organizace, repozitáře preprintů Prolinkování vvyhledaných výsledků s plnými texty v databázích (např. EBSCO, Proquest, JSTOR) podle institucionálních licencí. Samuel Clemens Bradford (1878 - 1948)
Institute for Scientific Information Philadelphia, Penn. 1960, E. Garfield chemik, lingvista, informatik Science Citation Index Impact Factor
Citační rejstříky Web of Knowledge http://isiknowledge.com Science Citation Index Social Sciences Citation Index Art & Humanities Citation Index
Citační analýza 1 Metoda hodnocení kvality a významu vědeckých publikací sledování četnosti citování Optimalizace informačních toků Profilování knihovních fondů Citační mapování vědy pomocí konstrukce citační sítě.
Citační analýza 2 Které prameny jsou v dokumentu citovány Ve kterých dokumentech je pramen citován Které dokumenty jsou citovány hodně / málo /vůbec Které citace se objevují často spolu Kteří autoři se objevují často spolu / se navzájem citují Které prameny jsou klíčové pro určitý obor / téma
Impakt faktor časopisů Faktor dopadu publikovaných výsledků na jejich praktické využití a rozvoj oboru Stupeň vědeckého uznání autora Ohlas publikací u odborné veřejnosti Stav a vývoj různých vědních disciplín ve světě v jednotlivých zemích na pracovištích.
Oblasti aplikace bibliometrického výzkumu 1 Zkoumání citačních vazeb dokumentů Citační analýza vědeckých časopisů Analýza publikační činnosti vědeckých pracovníků Zkoumání mezinárodních publikačních trendů Počítačová analýza publikací tvůrčích pracovníků Rozložení tvůrčí výkonnosti
Oblasti aplikace bibliometrického výzkumu 2 Zkoumání informačních potřeb Zjišťování tématického rozptylu literatury v časopisech Vyhledávání informací včetně hodnocení kvality Hodnocení vědců, publikací a vědeckých institucí
Problémy bibliometrie Nekompletnost údajů ISI citovanost i z jiných zdrojů (Scholar Google, Scopus) Autocitace rozumná míra, cykličnost vědy Vícenásobné autorství hodnocení pracoviště Kolísání v čase vědecké projekty (začátek – průběh – konec) Zvláštnosti vědních disciplín Různé možnosti publikovat Jazykové bariéry Chyby v citování Nadřazenost multidisciplinárních časopisů Impakt faktor časopisů monopol ISI, časová náročnost
Autorství Podíl vědců na Výzkumných projektech Vedení výzkumných skupin nemělo by se zapomínat na ty členy týmu, kteří sice nepřispívají aktivně k výzkumu, ale jsou důležití pro zajišťování prostředků na výzkum většinou jsou málo citovaní Účelové vzájemné citování Citování negativních výsledků.
Cíle informačních analýz Sledování úrovně a trendů rozvoje oborů, států, regionů … Hodnocení výsledků a přínosu vědy obory, týmy… Profilování a optimalizace informačních fondů vytipování nejvhodnějších zdrojů informací inovace fondu vzhledem k rozvoji oboru vytipování a odstranění zbytečných zdrojů informací rozbory spokojenosti uživatelů.
Závěr Citační analýza a její prostředky jsou doposud nejspolehlivějším nástrojem hodnocení vědeckého výzkumu, publikací, vědců a vědeckých institucí. Je nepostradatelná v modelování rozvoje výzkumu, vědy a technologie Je jedním z hodnotících kritérií vědeckého výkonu.
Literatura Na požádání u autorky přednášky potomkov@tunw.upol.cz