LiWA - Living Web Archives Libor Coufal Národní knihovna ČR
LiWA – Living Web Archives O projektu 2 ▫Výzkumný projekt zaměřený na oblast archivace webu ▫Financováno EU z prostředků 7. rámcového programu (€ ) ▫únor leden 2011 (36 měsíců)
LiWA – Living Web Archives Partneři 3 ▫Výzkumné organizace: Výzkumné centrum L3S, Leibnizova universita Hannover (koordinátor) Institut Maxe Plancka pro informatiku Výzkumný ústav počítačů a automatizace, Maďarská akademie věd ▫Webové archivy: Národní knihovna ČR Moravská zemská knihovna European Archive Hanzo Archives Ltd. Stichting Nederlands Instituut voor Beeld en Geluid
LiWA – Living Web Archives Motivace 4 ▫Webové technologie se neustále vyvíjejí a stávají se stále sofistikovanějšími
LiWA – Living Web Archives 5
6
Motivace 7 ▫Webové technologie se neustále vyvíjejí a stávají se stále sofistikovanějšími Scriptovací jazyky, Flash, multimédia, databáze, …
LiWA – Living Web Archives Motivace 8 ▫Webové technologie se neustále vyvíjejí a stávají se stále sofistikovanějšími ▫Nástroje pro archivaci webu narážejí na své hranice
LiWA – Living Web Archives Motivace 9 ▫Webové technologie se neustále vyvíjejí a stávají se stále sofistikovanějšími ▫Nástroje pro archivaci webu narážejí na své hranice ▫Dlouhodobá perspektiva webových archivů
LiWA – Living Web Archives 10
LiWA – Living Web Archives Cíl 11 ▫Nová generace technologií, která zvýší: Kvalitu webových archivů Jejich dlouhodobou využitelnost „Od prostého úložiště webových stránek k živoucím webovým archivům“ Dlouhodobá interpretovatelnost Zvýšená důvěryhodnost Rozmanitost obsahu
LiWA – Living Web Archives Oblasti výzkumu 12 ▫(Ne)kompletnost obsahu Extrakce ne-HTML odkazů Archivace skrytého webu Webové formuláře Jiné protokoly než http ▫Filtrace nepodstatného obsahu (šumu) Spam Webové pasti Detekce změn a duplikátů
LiWA – Living Web Archives Oblasti výzkumu 13 ▫Časová koheze Temporální skladba archivu (datování) Identifikace, analýza a korekce časových mezer Konzistence v rámci federovaných webových archívů ▫Sémantický vývoj a dlouhodobá interpretovatelnost Terminologická evoluce Sémantická evoluce
LiWA – Living Web Archives Výstup Sada inovativních služeb pro sklízení, uchování a obohacení obsahu Webu 2 demo aplikace: streaming a sociální web integrated reference open source solution for web archiving aligned with work of International Internet Preservation Consortium (IIPC) 14
LiWA – Living Web Archives WP7: LiWA Application „Streaming“ WP7: LiWA Application „Streaming“ Organization of Work WP1: Requirement Analysis WP1: Requirement Analysis WP4: Archive Coherence WP5: Handling Semantic Evolution WP5: Handling Semantic Evolution WP9: Project Management (LUH) WP10: Dissemination & Exploitation Architecture + Integration Activities „Living Web Archives“ (EA) Architecture + Integration Activities „Living Web Archives“ (EA) WP3: Data Cleansing + Noise Filtering WP8: LiWA Application „Social Web Archiving“ WP8: LiWA Application „Social Web Archiving“ WP2: Enhanced Capturing
Díky za pozornost Libor Coufal Odd. archivace webu Národní knihovna ČR