Analýza chování návštěvníků na webu Web Usage Mining, Clickstream Analysis, Web Analytics Tomáš Kliegr.

Slides:



Advertisements
Podobné prezentace
Web Michal Žůrek Jak se na něj dívám já..
Advertisements

Využití cloudových služeb ve školství
Jazyk HTML. Zdrojový kód  Elementy obsah obsah př. důležité př. důležité př. př.
Dynamické dokumenty na straně klienta Informatika pro ekonomy II.
Monitorovací systém Asistent
Jak vzniká mobilní stránka Seznamu
Jazyk HTML Název školyZákladní škola a Mateřská škola Tatenice Číslo projektuCZ Název šablony klíčové aktivity Inovace a zkvalitnění výuky pomocí.
CSS a HTML 5. HTML 5 HTML5 je nová verze specifikace značkovacího jazyka HTML, která přináší podstatné změny v technologiích webových stránek. HTML5 umožňuje.
HTTP server HTTP server 1 Jak to funguje?
Módy bezdrátového připojení
Adobe Dreamweaver CS4 Ing. Martin Dosedla.
Tvorba webů pomocí Web CMS Michal Neuwirth Product Manager Kentico Software s.r.o. Ondřej Výšek Samostatný konzultant Optimalizovane-it.
Informační systém Benefit7+
Analýza síťového provozu
Tvorba webových aplikací
1IT T ŘI PILÍŘE WEBU Ing. Jiří Šilhán. T ŘI PILÍŘE WWW WWW využívá počítačovou architekturu Klient/server, uživatel musí mít nainstalován prohlížeč, který.
„Firemní řešení avast! - rychle, efektivně, jinak“
INTERNET - TERMINOLOGIE
Moderní formy tvorby webových stránek Martin Šebela, 9.A vedoucí práce: Mgr. Jan Kříž.
© 2009 ET NETERA a.s. URCHIN – SERVEROVÁ VARIANTA GOOGLE ANALYTICS.
Vývoj aplikací pro SharePoint
Internet, WWW, HTML a spol.. Hlavní zásady inženýrství reprodukovatelnost měřitelnost a parametrizovatelnost přenositelnost typizace a standardizace dokumentace.
Návrh a tvorba WWW Přednáška 1
PHP – Základy programování
Aplikace VT v hospodářské praxi internetové technologie Ing. Roman Danel, Ph.D. VŠB – TU Ostrava.
Sdílení obsáhlých souborů na webu Výpočetní technika.
RTSP Real Time Streaming Protocol
Protokoly a adresy na internetu
Návrh a tvorba WWW Cvičení 4
WebMathematica MathMl.CDF aneb ZASE JEDEN POVEDENÝ PROJEKT Petr Bělaška OA aVOŠE Zlín.
Jazyk PHP Programovací jazyk PHP (Hypertext preprocessor) je skriptovací jazyk, který běží na straně serveru. KLIENT - SERVER Server posílá do vašeho počítače.
Představení nové verze OPSI Kamil Malinka Martin Lebeda PROJEKT financovaný z Operačního programu Vzdělávání pro konkurenceschopnost ZVYŠOVÁNÍ IT GRAMOTNOSTI.
Dílna Caché II. CSP pro pokročilé Tomáš Vaverka. Zdroje HTML Tag Reference v sekci Reference Material v dokumentaci Caché HTML Tag Reference v sekci Reference.
Internet.  Celosvětový systém propojených počítačů  Funkce  Sdílení dat  Elektronická pošta.
PROGRAMOVÁNÍ V PHP PERSONAL HOME PAGES SESSIONS. 2 COOKIES JEDNÁ SE O KRÁTKÉ TEXTOVÉ ŘETĚZCE, JEŽ SI MEZI SEBOU VYMĚŇUJÍ WEBOVÝ SERVER A WEBOVÝ KLIENT.
AJAX nejmodernější webová technologie… seminář pro učitele ZŠ a SŠ Mgr. Marek Osuchowski Ostravská univerzita © 2011.
Úvod do JavaScriptu JavaScript je p JavaScript je programovací jazyk, který se používá na webových stránkách. JavaScript je typu KLIENT - KLIENT To znamená,
CZ.1.07/1.4.00/ VY_32_INOVACE_168_IT 9 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
URL v HTML URL - Unique Resource Locator Příklad:
Jednotná informační brána Cyklus školení Elektronické informační zdroje a databáze Národní knihovna ČR , , , ,
IBM Global Services Ing. Stanislav Bíža, Senior IT Architect, CISA © 2005 IBM Corporation Rizika napadení webových aplikací Konference ISSS 2005 Title.
2OP381 Manažerská informatika 1
Úvod do PHP IZI 228.
Příležitost pro partnery s Windows 7 Lukáš Křovák Produktový manažer divize Windows
Posouzení možnosti využití ArcIMS pro prezentaci rozsáhlých rastrových dat Diplomová práce Vedoucí: Dr. Ing. Bronislava Horáková Zpracovatel:Tomáš Ježek.
Shrnutí Chceme–li připojit PC k Internetu musíme: 1.Zadat adresu DNS serveru (začne pracovat převod IP adresa  symbolické jméno), prakticky začne fungovat.
1 Protokol HTTP (Hypertext Transfer Protocol) HTTP je základem systému „World Wide Web“ (WWW) - Web … HTTP – jednoduchý protokol aplikační vrstvy, transport.
Podnikání na Internetu internet - zdroj informací Letní semestr 2005 Jana Holá III.
Přístup do IS z mobilních zařízení Tomáš Tureček Katedra Informatiky FEI VŠB-TU Ostrava.
Databázové systémy Přednáška č. 5 Datové typy a Fyzická organizace dat.
EndNoteWeb a ResearcherID – užitečné nástroje Web Of Science
Vzdálená správa Tomáš Kalný.
PHP Programy pro tvorbu WWW stránek - 01
Internetové publikování Doc. Ing. Petr Zámostný, Ph.D. místnost: A-72a tel.: 4222, 4167 (sekretariát ústavu 111)
Online nástroje pro sběr a administraci dotazníků Ladislava Suchá , Brno Zdroj obrázku: bredmaker, Sxc.hu.
Portál jako Dynamic WorkPlace.  Cleverbee s.r.o.  společnost založena 2000  15 let zkušeností (prodej a vývoj ERP řešení)  švýcarská společnost se.
Jak fungují webové stránky Úvod do HTML (1). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická.
EU peníze školám Registrační číslo projektu CZ.1.07/1.4.00/ Název projektu Inovace školství Šablona - název Inovace a zkvalitnění výuky prostřednictvím.
Internet. je celosvětový systém navzájem propojených počítačových sítí („síť sítí“), ve kterých mezi sebou počítače komunikují pomocí rodiny protokolů.
Internet (služby Internetu, WWW) Služby Internetu WWW (World Wide Web) – dnes nejrozšířenější služba; spoustě lidí splývá s Internetem jako takovým WWW.
Workshop, Knihovna AV ČR, 4. října 2010 Mgr. Tomáš Foltýn Kramerius 4 Uživatelské rozhraní Do verze
Zahradnická fakulta v Lednici S4U – Seminář o Univerzitním informačním systému 23. – 25. dubna 2008 S 4 U – Seminář o Univerzitním informačním systému.
Zabezpečení – CSRF, XSS Tomáš Hulák, Miroslav Kořínek.
Redakční systém – Content management system (CMS), publikační systém – Správa obsahu webu – Jednoduché publikování textů – Modulárnost (instalace doplňků)
Anotace Materiál je určen pro 1. ročník studijního oboru M/01 PROVOZ A EKONOMIKA DOPRAVY, předmětu Informační a komunikační technologie, inovuje.
Internet – pojmy, služby
„Firemní řešení avast! - rychle, efektivně, jinak“
Protokol HTTP (Hypertext Transfer Protocol)
Představení Úvod Celé je to pojaté spíše jako představení služby a jejích možností, nežli konkrétní ukázky Lukáš Čochner.
Nové webové mapové aplikace ČGS RNDr. Vít Štrupl, PhD. Nesuchyně 4. 4
Transkript prezentace:

Analýza chování návštěvníků na webu Web Usage Mining, Clickstream Analysis, Web Analytics Tomáš Kliegr

Osnova Definice Sběr dat Předzpracování JS tracker Google Analytics

Definice Clickstream analysis: proces sběru, analýzy a reportování agregátních dat o tom, jaké stránky si návštěvníci zobrazují a v jakém pořadí Web Usage Mining (přibližně): clickstream analýza jako vědecká disciplína Web Analytics (přibližně): clickstream analýza v praxi

Cíle clickstream analýzy Úlohy clickstream analýzy se obvykle rozdělují na: Analýzu provozu (traffic analysis) – Cesty návštěvníků po webu – Důraz na typické chování návštěvníků E-Commerce analýzu – Určení efektivity prodeje – Důraz na referrery (odkud návštěvník přišel?) a konverze (koupil něco?)

Způsoby sběru dat Log webového serveru Proxy servery TCP/IP packet sniffer – Příliš složité v praxi (facca?) Javascript tracker Klientská aplikace (toolbar) Každý z uvedených způsobů má své klady a zápory Vhodné kombinovat

Log webového serveru Webové servery (IIS, Apache) lze nastavit tak, aby vytvářely záznamy o požadavcích na ně učiněných Historicky zřejmě nejstarší způsob Dnes problémy s přesností

Příklad položek logu REMOTE HOST IP REMOTE HOST LOGIN NAME AUTH Login DATE REQUEST - přesné znění příkazu zaslaného webovému serveru WEB SERVER’s RETURN CODE SIZE OF RETURNED FILE REFERRER – URL stránky, která na požadovaný resource odkazovala USER AGENT

Proxy Servery Možnost získat data o provozu na vícero webech Nejkomplexnější data Zaznamená i požadavky, které na webový server vůbec nedorazí (jsou obslouženy proxy) Data z proxy serverů se dají koupit, nebo je možné je získat provozem vlastního proxy serveru – Google Web Accelarator: ”’..we may use log information about Google Web Accelerator usage to improve the quality of Google Web Accelerator and other Google services.“ Obvykle ale přístup k datům z dostatečně reprezentativního proxy serveru není k dispozici

Javascript Tracker Příklad realizace javascript trackeru (serverová část na MS technologii)

Klientská aplikace Java Applet(Shababi) Pomocí eyetrackeru lze např. studovat souvislost mezi pořadím linku ve výsledcích a pozorností, kterou získá. Míra pozornosti která se dostává linkům na 1. a 2. pozici je téměř stejná (Granka) – obr. ukazuje počet výsledků pod a nad vybraným dokumentem, který návštěvníci skenují

Javascript Tracker detailně Viz případová studie

Předzpracování získaných dat Liší se v závislosti od datového zdroje Náročná je kvalitní příprava dat z log souborů Pomocí Javascriptu to lze snadno

Předzpracování log souboru (Reichle et al)

Předzpracování log souboru Vynechání požadavků na obrázky Analýza refereru URL Encoding se používá pro zakódování speciálních znaků v URL – obvzlášť důležité v češtině Rozpoznání relací – existuje řada heuristik – Např. stejná zdrojová IP adresa a časový interval mezi dvěma požadavky max. 20 min. – Jedno ze slabých míst log souborů Identifikace robotů – lze dosáhnout cca 90% spolehlivost (Geens) – Seznamy user-agentů, IP adres, požadavek HEAD místo GET – Typicky nestahují obrázky a mají prázdná referrer Případně zpracování cookies, které mohou být v log souboru též uvedeny

Srovnání Bez problémů s proxy a cachemi Trackuje klient-side události (Javascript, Flash, Web 2.0) Klientské zachycení E-commerce dat Sběr dat v reálném čase Outsourcované aktualizace softwaru Efektivní ukládání dat, které může být snadno outsourcováno Znovupoužití historických dat Bez problémů s Firewally Lze sledovat bandwidth a dokončené downloady Automaticky sleduje spidery a roboty Automaticky sleduje návštěvníky z mobilních zařízení Transparentnost pro návštěvníka Špatné nastavení vede ke ztrátě dat Firewally mohou omezit použití tagů Výsledek měření je závislý na umístění tracking codu (začátek/konec body sekce) Nelze trackovat spidery Nepřesnosti spojené s proxy a cachováním Nelze sledovat události (js, Flash,W 2.0) Obecně složitější aktualizace a data storage Neefektivní datový formát Možné problémy v případě, že je použit přepis adres (ISAPI filter n. mod_rewrite) Upraveno dle Web analytics whitepape, Advanced-web-metrics.com Javascript (Page Tagging)Analýza logů

Kdy javascript tracker nemusí fungovat správně Prohlížeč nepodporuje cookies, podpora cookie je vypnuta nebo omezena na cookie prvních stran. Prohlížeč nestahuje obrázky Prohlížeč nepodporuje javascript Prohlížeč blokuje konkrétní scripty (adblocker) Reálným problémem je především podpora cookies – oom/NewsRoomArchive/2005/CookieRejection.aspx

Přehled komerčních řešení Špička – Omniture – Clicktracks – Webtrends „Contender“ – Google Analytics Jednoduché srovnání viz: web-data-sources.pdf Aktualizovaná srovnání produktů v Forrest Wave (r) – Web Analytics

Případová studie: Google Analytics INterceptor Rozšíření Google Analytics, které umí zasílat data jak na lokální server tak i na vzdálený Využívá možnosti placené verze Urchin, která umožňuje logovat požadavky i pomocí lokálního log souboru (vyšší přesnost) Google Analytics Google Analytics INterpceptor

Vložení trackovacího kódu <script src=" analytics.com/urchin.js" type="text/javascript"> _ugifpath=" _userv=2; _uacct = "UA "; _udn="none"; _ulink=1; urchinTracker(); Upozornění: stará verze GA

Mechanizmus předávání kliknutí z javascriptu na sledovácí server if ((_userv==0 || _userv==2) && _uSP()) { i[ii]=new Image(1,1); i[ii].src=_ugifpath+"?"+"utmwv="+_uwv+s; i[ii].onload=function() { _uVoid(); } } if ((_userv==1 || _userv==2) && _uSP()) { i2[ii]=new Image(1,1); i2[ii].src=_ugifpath2+"?"+"utmwv="+_uwv+s+"&utmac ="+_uacct+"&utmcc="+c; i2[ii].onload=function() { _uVoid(); } } _ugifpath = analytics.com/_utm.gif Upozornění: stará verze GA