Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)

Slides:



Advertisements
Podobné prezentace
INTERNET A WORL WIDE WEB JAKO SOUČÁST INFORMAČNÍHO SYSTÉMU ZÁKLADNÍ ŠKOLY Petr Vitásek, 2004 Diplomová práce.
Advertisements

Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
Nový přístup k aplikacím Vema
Proč jsme vytvořili vlastní filtr Kernun Clear Web. Filtrujete bez filtru? Josef Pojsl, TNS / Kernun Security Notes / Praha 11. října 2012.
Základy databázových systémů
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Microsoft Office OneNote
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Přednáška č. 5 Proces návrhu databáze
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Projekt Informační a vzdělávací portál Libereckého kraje I CZ.1.07/1.1.00/ I Technologie portálu Pavel Krayzel CELN o.s.
Technologie pro CI. Od technologií pro CI vyžadujeme především funkce vyhledávání v rozsáhlých databázích na základě libovolných dotazů, propojování a.
Úvod do databází Databáze.
Tvorba webových aplikací
SFX Funkcie systému Ing. Lukáš Budínský. 2 Pracovní setkání Metalib/SFX – Obsah prezentace SFX Představení technologie Hlavní přínosy Nadstavbové.
Pedagogické kompetence 6. října 2014 Caroline Kearney vedoucí manažerka projektů & analytička vzdělávání.
Praha6.cz Nové trendy v e-publishingu Statické stránky, mapa stránek, menu a fulltextové vyhledávání.
Bakalářský seminář Úvod BP Závěr BP.
Celostátní síť pro venkov
PHP – Základy programování
Systémy pro podporu managementu 2
BAKALÁŘSKÁ PRÁCE Tomáš Janda
Relační databáze.
Databázové systémy. Práce s daty Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace.
Databázové systémy Architektury DBS.
Základní pojmy Systém je abstrakce, kterou si lidé vytvářejí v procesu poznávání jako nástroj zkoumání reálných objektů.
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Informatika pro ekonomy II přednáška 10
Dokumentace objektů a zveřejnění funkcí
Vzdělávací technologie 2 Tvorba jednoduchých webových stránek Martin Böhm (L06514)
Internet.  Celosvětový systém propojených počítačů  Funkce  Sdílení dat  Elektronická pošta.
Seminář HCI, ÚISK FF UK, HCI v kontextu kognitivní vědy.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Systémová integrace Big Data
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
© 2007 IBM Corporation Duben, 2007 Dokumentová řešení IBM pro státní správu Daniel Beneš.
Databázové modelování
2 Fučíková Sylvie HR/Win – moderní technologie pro osvědčené aplikace.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Databázové systémy Informatika pro ekonomy, př. 18.
MALÉ SOCIÁLNÍ SKUPINY.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Přístup do IS z mobilních zařízení Tomáš Tureček Katedra Informatiky FEI VŠB-TU Ostrava.
Úvodní informace Informatika pro ekonomy II ZS 2011/2012.
IBM - CVUT Student Research Projects Google search by voice Tomáš Losert – Karel Beyr –
Adaptivní webové systémy v e-learningu Miroslav Bureš Odborná skupina Webing, katedra počítačů.
2 Karla Halenková Setkání uživatelů 2001 Báze znalostí produkt pro naplnění uživatelem.
Úvodní informace Informatika pro ekonomy II LS 2007/2008.
České vysoké učení technické v Praze Fakulta stavební Katedra mapování a kartografie Návrh koncepce prostorového informačního systému památkového objektu.
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
Základní problémy realizace eLearningového systému Roman Malo Ústav informatiky PEF MZLU v Brně.
TVORBA STUDIJNÍCH TEXTŮ V DISTANČNÍM VZDĚLÁVÁNÍ Simona F e i t o v á Centrum distančního vzdělávání Univerzity Palackého v Olomouci.
Geografické informační systémy pojetí, definice, součásti
Mgr. Katarína Nemčíková, VÚP Praha Změny v kurikulárních dokumentech základního vzdělávání.
 nejvíce využívaná služba internetu založená na www stránkách  poskytuje virtuální informační prostor, přístupný pomocí prohlížeče  výhodou www stránek.
Internet. je celosvětový systém navzájem propojených počítačových sítí („síť sítí“), ve kterých mezi sebou počítače komunikují pomocí rodiny protokolů.
Moderní informační systémy - úvod do teorie, druhy IS v cestovním ruchu.
Proč jsme vytvořili vlastní webfiltr Kernun Clear Web Filtrujete bez filtru? Josef Pojsl, TNS / Seminář WEBFILTR Kernun / Praha 6. února.
Databáze ● úložiště dat s definovaným přístupem ● typy struktury – strom, sekvence, tabulka ● sestává z uspořádaných záznamů ● databáze – struktura – záznam.
Dobývání znalostí z databází znalosti
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Databázové systémy přednáška 13 – Analýza a reporting
Projekt - K620 Řízení a modelování silniční dopravy
Informatika pro ekonomy přednáška 8
Ing. Milan Houška KOSA PEF ČZU v Praze
Přednášky z Distribuovaných systémů
Transkript prezentace:

Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)

Vítězslav Šimon (SIM0047) Obsah prezentace Východiska a současný stav Dolování (webových) dat Webová komunita a analýza sociálních sítí Charakteristiky webových dat Charakteristiky webových dat Webová komunita Webová komunita Sociální sítě Sociální sítě

Vítězslav Šimon (SIM0047) Východiska a současný stav explozivní růst množství informací z WWW vytvořil mocnou platformou pro šíření a získávání zajímavých informací Data jsou rozsáhlá, různorodá, dynamická a nestrukturovaná, mají distribuované umístění, problematická škálovatelnost, vyhledávání

Vítězslav Šimon (SIM0047) Některé příkladové aplikace Nalezení podstatné nebo zásadní informace (procházení/vyhledávač, přesnost a vypovídací schopnost výsledku) Nalezení potřebné informace (klíčová slova, sémantika) Získání užitečných znalostí (data mining) Doporučování/Personalizace informací (preference uživatelů)

Vítězslav Šimon (SIM0047) Některé příkladové aplikace Webové komunity a sociální sítě (SŘBD x Web, sdružené vazby, propagace komunita -> sociální síť, DBLP)

Vítězslav Šimon (SIM0047) Dolování dat (DM) Přístup ke zpracování (velkého množství různých) dat (z různých zdrojů) s cílem získávání znalostí z nich. Základní cíl je objevení skryté nebo neviděné informace, běžné ve formách nebo vzorech ve zkoumaných datech. Časté postupy a implementace: DM na základě asociačních pravidel, sekvenčních vzorů, učící algoritmy s/bez učitele

Vítězslav Šimon (SIM0047) Dolování dat z Webu (WM) Web je/má: velký repozitář dat velký repozitář dat zdroj sestávající různých typů dat zdroj sestávající různých typů dat velké množství nepatrných informací (na první pohled) velké množství nepatrných informací (na první pohled) WM = použití data mining metod k získávání užitečných informací z webových dat Používána paradigmata data miningová nebo strojového učení

Vítězslav Šimon (SIM0047) Dolování dat z Webu (WM) 3 skupiny (podle cíle): Obsahu (texty) = dolování textu Obsahu (texty) = dolování textu Struktury (odkazy (hyperlinky) a struktury) -> vymezení komunit stránek, podobnost, relevance Struktury (odkazy (hyperlinky) a struktury) -> vymezení komunit stránek, podobnost, relevance Použití (vzory použití z webových transakcí nebo dat jednotlivých relací v logovacích souborech) -> více vhodných informací, menší prodlevy v odpovědích webu Použití (vzory použití z webových transakcí nebo dat jednotlivých relací v logovacích souborech) -> více vhodných informací, menší prodlevy v odpovědích webu

Vítězslav Šimon (SIM0047) Webová komunita a analýza sociálních sítí Charakteristiky webových dat Web X SŘBD velké množství dat na Webu ( tis., 1998 – 2 mil.) velké množství dat na Webu ( tis., 1998 – 2 mil.) distribuovaná a heterogenní data (koncepce, více serverů napříč světem, multimédia a text) distribuovaná a heterogenní data (koncepce, více serverů napříč světem, multimédia a text) nestrukturovaná data (nepřesné normy x DB datové typy, HTML upraveno v základech) nestrukturovaná data (nepřesné normy x DB datové typy, HTML upraveno v základech) dynamická data (data v DB, vizualizace snadno měnitelná) dynamická data (data v DB, vizualizace snadno měnitelná)

Vítězslav Šimon (SIM0047) Webová komunita (WC) = uskupení webových objektů v podmínkách webových stránek nebo uživatelů, kde je každý člen volně propojen na jiný z dané množiny Struktura dat v DB jasně definována X webový objekt (množství typů roste)

Vítězslav Šimon (SIM0047) Webová komunita (WC) Vybrané aplikace nalezení WC z datových zdrojů analýzou odkazů (WC = skupina stránek, kde všichni členové sdílí stejnou hierarchii/topologii odkazů k 1 stránce) e-commerce - analýza nákupního košíku (WC = kategorie uživatelů, reprezentujících různé typy chování zákazníků)

Vítězslav Šimon (SIM0047) Sociální sítě (SN) = reprezentant relací uvnitř komunity SN zajišťují prostředky pro studium vzájemných vazeb a síťových struktur, často odvozených a vyjádřených spoluprácemi napříč komunitou WC může být modelována jako SN – síť uživatelů vyměňujících si informace nebo vykazujících společný zájem koncepty přenositelné mezi SN a WC

Děkuji za pozornost. Prostor pro dotazy …