Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)

Podobné prezentace


Prezentace na téma: "Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)"— Transkript prezentace:

1 Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)

2 222.02.2014Vítězslav Šimon (SIM0047) Obsah prezentace Východiska a současný stav Dolování (webových) dat Webová komunita a analýza sociálních sítí Charakteristiky webových dat Charakteristiky webových dat Webová komunita Webová komunita Sociální sítě Sociální sítě

3 322.02.2014Vítězslav Šimon (SIM0047) Východiska a současný stav explozivní růst množství informací z WWW vytvořil mocnou platformou pro šíření a získávání zajímavých informací Data jsou rozsáhlá, různorodá, dynamická a nestrukturovaná, mají distribuované umístění, problematická škálovatelnost, vyhledávání

4 422.02.2014Vítězslav Šimon (SIM0047) Některé příkladové aplikace Nalezení podstatné nebo zásadní informace (procházení/vyhledávač, přesnost a vypovídací schopnost výsledku) Nalezení potřebné informace (klíčová slova, sémantika) Získání užitečných znalostí (data mining) Doporučování/Personalizace informací (preference uživatelů)

5 522.02.2014Vítězslav Šimon (SIM0047) Některé příkladové aplikace Webové komunity a sociální sítě (SŘBD x Web, sdružené vazby, propagace komunita -> sociální síť, DBLP)

6 622.02.2014Vítězslav Šimon (SIM0047) Dolování dat (DM) Přístup ke zpracování (velkého množství různých) dat (z různých zdrojů) s cílem získávání znalostí z nich. Základní cíl je objevení skryté nebo neviděné informace, běžné ve formách nebo vzorech ve zkoumaných datech. Časté postupy a implementace: DM na základě asociačních pravidel, sekvenčních vzorů, učící algoritmy s/bez učitele

7 722.02.2014Vítězslav Šimon (SIM0047) Dolování dat z Webu (WM) Web je/má: velký repozitář dat velký repozitář dat zdroj sestávající různých typů dat zdroj sestávající různých typů dat velké množství nepatrných informací (na první pohled) velké množství nepatrných informací (na první pohled) WM = použití data mining metod k získávání užitečných informací z webových dat Používána paradigmata data miningová nebo strojového učení

8 822.02.2014Vítězslav Šimon (SIM0047) Dolování dat z Webu (WM) 3 skupiny (podle cíle): Obsahu (texty) = dolování textu Obsahu (texty) = dolování textu Struktury (odkazy (hyperlinky) a struktury) -> vymezení komunit stránek, podobnost, relevance Struktury (odkazy (hyperlinky) a struktury) -> vymezení komunit stránek, podobnost, relevance Použití (vzory použití z webových transakcí nebo dat jednotlivých relací v logovacích souborech) -> více vhodných informací, menší prodlevy v odpovědích webu Použití (vzory použití z webových transakcí nebo dat jednotlivých relací v logovacích souborech) -> více vhodných informací, menší prodlevy v odpovědích webu

9 922.02.2014Vítězslav Šimon (SIM0047) Webová komunita a analýza sociálních sítí Charakteristiky webových dat Web X SŘBD velké množství dat na Webu (1994 - 110 tis., 1998 – 2 mil.) velké množství dat na Webu (1994 - 110 tis., 1998 – 2 mil.) distribuovaná a heterogenní data (koncepce, více serverů napříč světem, multimédia a text) distribuovaná a heterogenní data (koncepce, více serverů napříč světem, multimédia a text) nestrukturovaná data (nepřesné normy x DB datové typy, HTML upraveno v základech) nestrukturovaná data (nepřesné normy x DB datové typy, HTML upraveno v základech) dynamická data (data v DB, vizualizace snadno měnitelná) dynamická data (data v DB, vizualizace snadno měnitelná)

10 1022.02.2014Vítězslav Šimon (SIM0047) Webová komunita (WC) = uskupení webových objektů v podmínkách webových stránek nebo uživatelů, kde je každý člen volně propojen na jiný z dané množiny Struktura dat v DB jasně definována X webový objekt (množství typů roste)

11 1122.02.2014Vítězslav Šimon (SIM0047) Webová komunita (WC) Vybrané aplikace nalezení WC z datových zdrojů analýzou odkazů (WC = skupina stránek, kde všichni členové sdílí stejnou hierarchii/topologii odkazů k 1 stránce) e-commerce - analýza nákupního košíku (WC = kategorie uživatelů, reprezentujících různé typy chování zákazníků)

12 1222.02.2014Vítězslav Šimon (SIM0047) Sociální sítě (SN) = reprezentant relací uvnitř komunity SN zajišťují prostředky pro studium vzájemných vazeb a síťových struktur, často odvozených a vyjádřených spoluprácemi napříč komunitou WC může být modelována jako SN – síť uživatelů vyměňujících si informace nebo vykazujících společný zájem koncepty přenositelné mezi SN a WC

13 Děkuji za pozornost. Prostor pro dotazy …


Stáhnout ppt "Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)"

Podobné prezentace


Reklamy Google