Fulltext pro VŠE Jakub Černý, Ph.D. VŠE Praha,

Slides:



Advertisements
Podobné prezentace
Vyhledávací stoje na Internetu. (vyhledavače pro začátečníky)
Advertisements

Střední škola služeb a podnikání, Ostrava-Poruba příspěvková organizace Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:
Jak úspěšně inzerovat pomocí PPC. Obsah (aneb co všechno se dozvím )  Pro koho je PPC vhodné  Hlavní výhody pro klienta  Proč používat právě.
Štěpán Šípal Gymnázium Čakovice. Dnešní témata  Vznik XHTML a předchůdci  Základní prvky XHTML dokumentu  Tagy a atributy  Elementy a jejich druhy.
ZÁKLADY HTML Číslo DUM: VY_32_INOVACE_04_11 Autor: Mgr. Ivana Matyášková Datum vytvoření: duben 2013 Ročník: tercie Vzdělávací obor: informační technologie.
Jak vzniká mobilní stránka Seznamu
Technologie pro publikování na webu 1 Cvičení 3 Nadpisy a základní formátovací elementy.
Jak naučit zákazníky, aby měli rádi vaši online samoobsluhu Marta Drahovzalová eBusiness manager T-Mobile Konference WebTop
Jak se stát miláčkem vyhledávačů
Základy HTML.
Jak na web První krůčky Lukáš Reindl. Co je potřeba Budeme potřebovat počítač, na kterém běží alespoň nějaký jednoduchý textový editor (ve Windows Notepad.
SEO pro novou firmu Bartošová Lenka 3MA
Funkce programu Microsoft Word 2003 vhodné pro úpravu studentských prací Petr Křivánek.
Funkce programu Microsoft Word 2010 vhodné pro úpravu studentských prací Petr Křivánek.
školení internetového vyhledávače
Internet Definice Historie Použití Programy pro práci s internetem
Školení internetového vyhledavače Co je to internetový vyhledávač Aplikace na internetu,která dokáže podle klíčového slova najít internetovou.
 Search engine optimization  Jeden z prvních kroků při tvorbě obsahu webových stránek  Výrazně ovlivňuje dohledatelnost, návštěvnost a tím i úspěšnost.
Školení zaměstnanců web + intranet v Praze.
SEO SEO Optimalizace webových stránek pro vyhledávače Jan Nemrava, KIZI, FIS VŠE
Představujeme službu Samepage
použitelnost webu (usability)
Systémy pro podporu managementu 2
Manažerské informační systémy Ing. Dagmar Řešetková
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Jiří Štěpán, duben 2010 Vlastnosti úspěšných webových prezentací.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Manažerské informační systémy Ing. Dagmar Řešetková
Nové funkce v novém Skliku
Jak propagovat web? Jiří Pilnáček, Turistika.cz, s.r.o.
WWW – hypertextový informační systém
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_246 Název školyGymnázium, Tachov, Pionýrská 1370 Autor Ing. Roman Bartoš Předmět Informatika.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
PPC Cílená, měřitelná a efektivní reklama Aleš Miklík, Lupa.cz.
O službě Webmium WEBMIUM je jednoduchý nástroj umožňující drobným a středním podnikatelům vytvoření a správu profesionálně vypadajících webových stránek.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Jak vyhledávat informace na Internetu?
CZ.1.07/1.4.00/ VY_32_INOVACE_154_IT5 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
Úvod do studia Strategie vyhledávání zdrojů Robert Zbíral.
Jak hledat co nejefektivněji na internetu? Referát Počítačová gramotnost II. Věra Anthová,
Školení WordPress a publikování na webu Mgr. Pavel Krejčí
Marketingový průzkum Milan Mrázek Matematika & Business
… najdu tam, co neznám !. … najdu tam, co neznám ! Historie vývoje Leden 2009 první kroky k vývoji nového systému Duben 2009.
SEO – optimalizace pro vyhledávače
Školení internetového vyhledávače
Internet – služby Název školyGymnázium Zlín - Lesní čtvrť Číslo projektuCZ.1.07/1.5.00/ Název projektuRozvoj žákovských kompetencí.
TOMÁŠ RUPRICH E-TECHNOLOGIE LS 2008/09 Google hacking.
Vyhledávání na internetu, SEO
KURZ ZÁKLADY PRÁCE S POČÍTAČEM 1 Vyhledávání na internetu Autor: Mgr. Aleš Kozák.
VY_I/2_INOVACE_37_Vyhledávání na internetu Vyhledávání na internetu Miroslav Kaňok.
1 Základy marketingového výzkumu Online marketing.
Kurz pro studenty oboru Informační studia a knihovnictví Úvodní hodina Martin Krčál Brno, FF MU,
SEO – optimalizace pro vyhledávače Tereza Balabánová
Kurz pro studenty oboru Informační studia a knihovnictví Úvodní hodina Tereza Balabánová Martin Krčál Brno, FF MU,
Metody sociálního výzkumu 3. blok Denní studium LS 2008/ blok.
Personální audit - cesta k efektivitě využívání lidských zdrojů.
INTERNET Mgr. Petra Toboříková. Internet = celosvětový systém navzájem propojených počítačových sítí –WWW (text, grafika a multimédia - hypertextové odkazy)
_ KOMUNIKAČNÍ A MEDIÁLNÍ STRATEGIE KAMPANĚ NA 1.
Provázanost mobilní reklamy s webem Tomáš Košťál … najdu tam, co neznám !
… najdu tam, co neznám! Měření efektivity PPC reklamy.
Zahradnická fakulta v Lednici S4U – Seminář o Univerzitním informačním systému 23. – 25. dubna 2008 S 4 U – Seminář o Univerzitním informačním systému.
SEO ANALYTIKA Romana Velflová - medio.cz. Mám spoustu obsahu, ale malou návštěvnost dotaz cílová stránka počet stránek webu počet crawlovaných stránek.
Tribuna českého obchodu TZB
INTERNET Pro 5. ročník.
Výpočetní technika VY_32_INOVACE_17_16_internetový vyhledávač.
VIKMA06 Rešeršní a studijně rozborová činnost
Metody a techniky výzkumu II.
Tvorba webových stránek na google – Sites (4.)
Představení Úvod Celé je to pojaté spíše jako představení služby a jejích možností, nežli konkrétní ukázky Lukáš Čochner.
Tvorba webových stránek na google – Sites (8.)
Transkript prezentace:

Fulltext pro VŠE Jakub Černý, Ph.D. VŠE Praha, 24.11.2009 www.seznam.cz … najdu tam, co neznám !

Co dnes servírujeme? Jak měřit kvalitu fulltextu? Jak se srovnávat s konkurencí? Jak nastavovat parametry algoritmu hledání? Jak funguje textový signál relevance? SEO pro běžné uživatele z pohledu lidí, co píší fulltext Co byste chtěli slyšet vy?

Jak tečou uživatelé internetem? Internet a odkazy jsou jako dálnice co dělá běžný uživatel z pohledu mimozemšťana? Kde každý začíná? homepage, fulltext, znám adresu Máte webový portál, kde sehnat návštěvníky? postavit lepší přípojku z dálnice (SEO) reklama

Znovu objevení kola

Seznam vs. Google Proč Seznam vydrží?

Opakování: Jak funguje Fulltext Robot Příprava Internet Hledání

Jak měřit úspěch?

Proč? Co chceme? Měření kvality vyhledávačů Srovnání Seznamu s konkurencí Kdo je lepší? Na kterých kategoriích? Na kterých dotazech? Jak popsat skupinu dotazů, kde se to děje? Dostaneme tip, co zlepšovat Měřitelnost toho, jak jsme se zlepšili

Jak měřit kvalitu výsledků fulltextového hledání? Otázka pro vás: Jak měřit kvalitu výsledků fulltextového hledání? Čistě výsledky, ne rychlost hledání, kvalitu webovky, snippetů

Kalibrace Vital Usefull Relevant Non-relevant Off-topic

Kalibrace Vital Usefull Relevant Non-relevant Off-topic (navigační výsledek) Dotaz má jasnou interpretaci a stránka je oficiální stránkou (jedinečnost). q=youtube … youtube.cz (užitečný výsledek) Stránka je hodně uspokojující, vyčerpávající výklad, vysoká kvalita,důvěryhodný zdroj. q=houby … atlashub.cz (užitečný výsledek). Stránka je hodně uspokojující, vyčerpávající výklad, vysoká kvalita,důvěryhodný zdroj. q=houby … atlashub.cz (dobrý výsledek) q=harry potter … knihy.cz/prodej/harry-potter (dobrý výsledek). q=harry potter … knihy.cz/prodej/harry-potter (blbý výsledek). Sice je to k tématu, ale není užitečné (málo informací, staré info, příliš obecné). q=praha … zoopraha.cz (blbý výsledek) Sice je to k tématu, ale není užitečné (málo informací, staré info, příliš obecné). q=praha … zoopraha.cz (výsledek mimo mísu). Výsledek obsahuje hledaná slova, ale tématicky je mimo. q=houby … „je to na houby“ (výsledek mimo mísu) Výsledek obsahuje hledaná slova, ale tématicky je mimo. q=houby … „je to na houby“

Kalibrace Výběr dotazů Sociodemo kalibrátorů Porozumění dotazu Kvalifikace pro zhodnocení kvality Muži vs. ženy (fotbal x parfémy) Puberťáci vs. důchodci (q=hudba)

Přínosy Zrychlení a flexibilita v nastavování parametrů fulltextu Rozhodování se na základě reálných dat Rychlejší vývoj a testování změn relevance fulltextu (prototypy úprav). Přenesení práce na externí kalibrátory Bonzování, co jsou nepovedené dotazy a jejich následné sledování -- víme na co se zaměřit Včas zjistíme, jak se zlepšila konkurence, co provedli -- můžeme je včas dohnat

Závěr k měření kvality Rozhodování se podle faktů ne názorů Je to první důležitý krok, další musí následovat Potřebujeme naslouchat všem uživatelům a ne jen pár vyvoleným (kalibrátorům)

Automatické ladění parametrů fulltextu

Jak nastavit parametry na optimum? Výdej výsledků Data Data Data Data

Historie ladění parametrů v Seznamu Od oka nějak nastavit parametry a pak to nějak zkoumat ve více lidech od oka, pak se hádáme každý dodá dotazy, kde jsme lepší, horší, beze změny Využití kalibrací a měření kvality fulltextu Ručně nastavovat, ale hned vidím kvalitu (i dotazy, na kterých to drhne) Automatické nastavování vah

Nastavovače vah

Nastavovače vah

Jak odstranit bottle neck? Otázka pro vás: Jak odstranit bottle neck? Nastavování vah je pomalé, protože když změníme parametry, tak se musíme pro všechny nakalibrované dotazy zeptat fulltextu na nové pořadí výsledků. Nastavovač User Fulltext 80 strojů

Textový signál relevance

Textový signál relevance Je to názorná ukázka evoluce 1 signálu Uslyšíte, jak to funguje hledání v textech na vašich stránkách (to můžete ovlivnit)

Vývojové generace TXT signálu Jen slova z dotazu, přesná shoda tvaru Jen 50% relevantních dokumentů obsahuje slova z dotazu.

Vývojové generace TXT signálu Přidání lemmatizace slov Různé váhy slov podle výskytiště (H1, URL, Title, odstavec, bold, …) Příklady vtipné lematizace: Stát, ženu, lov lína, barum, jizdní rady, dog

Vývojové generace TXT signálu Různé váhy slov podle jejich korpusové četnosti tf x idf vynechávání slov Příklad dotazů: Petr a Pavel, Jak se odstraňuje vosí hnízdo?

Otázka pro vás: Máte 3-slovný dotaz. Je lepší, když se slova z dotazu najdou blíže u sebe a nebo je to jedno?

Vývojové generace TXT signálu Proximita a pořadí slov z dotazu Příklady: Jakub Černý x Černý Jakub Václav Klaus video Já do lesa nepojedu, já do lesa nepůjdu Kolokace Velký vůz, černý petr, Česká republika

Vývojové generace TXT signálu Předzpracování dotazu Poslechnu si uživatele a přeložím to do jazyka, ve kterém fulltext umí vyhledávat. Nastavení proximity, … Příklady: VŠE, MŽP, IE8 (ale i naopak) Kdy vyhořelo Národní divadlo? (běžné otázky jako na kamaráda)

Vývojové generace TXT signálu Doplňování slov odjinud ze zpětných odkazů (bazén podolí) anonymní termy jméno, datum, místo, video pro odpovědi na otázky: Kdo? Kdy? Kde? Příklady: Václav Klaus video Kdy vyhořelo Národní divadlo?

Další okolnosti kolem TXT signálu Body text extraction (BTE) Site-wide texty (SWT) rozpoznání důležitosti slov podle vzhledu site odstranění neopodstatněných nároků na důležitost Všechny texty v H1 apod. Různé chování pro různé kategorie dotazů: Navigační Informační Transakční

Další okolnosti kolem TXT signálu Desambigulace Vyloučení nejednoznačnosti Řekněte mi něco o německých tancích? Hrách vs. (o počítačových) hrách

SEO

Jak to funguje ve fulltextu Uvidíte, že SEOptimalizátoři někdy vaří z vody a tvrdí blbosti. (ale hlavně že zákazník zaplatí). Úkoly SEO: Pořadí výsledků být v první 10ce výsledků Snippety kvalitní popisek u výsledku ovlivňuje to CTR výsledku Robot a rychlá indexace Pozor na náklady! Krásný web neznamená nalezitelný web! Stroje mají jiné oči.

Pořadí výsledků Mixování signálů relevance: Kdo je lepší? Jak to míchat?

Doména, historie, struktura stránky Signály relevance On page Off page User obecné Doména, historie, struktura stránky Page Rank ??? tématické (k dotazu) TXT ZO

Úspěch záleží i na samotných uživatelých Sice je nalákáte na svůj web, ale když se jim tam nebude líbit, tak utečou. Relevantvní obsah Jasná navigace Výzva k akci Identifikace webu: kontaktní údaje Doporučení: Steve Krug: Web design: Nenuťte uživatele přemýšlet!

SEO - Rada Všeho s mírou. Každá rada jde přehnat a zprasit. Pak je to často naškodu. Pište dobrý a užitečný web, vykašlete se na podvody. (Uznejte, že někdo může být lepší). Rozdíl mezi SEO a praSEo.

SEO – On page faktory Volba klíčových slov Copywriting Nástroje pro analýzu klíčových slov (Sklik, AdWords, …) Statistiky Seznamu Long tail Copywriting Titulek, URL, nadpisy, alt Meta description, katalogový popisek

SEO – Off page faktory Zpětné odkazy Odkazová síť Interní x externí Důležitý je text odkazu, zohledňuje se i okolí Tématická podobnost odkazované stránky Odkazová síť Page rank

SEO - Snippety Ovlivňují proklikovost výsledku Jejich cíl: Ve dvou větách ukázat, o čem je váš web Ukázat v jakých souvislostech se nalezla slova z dotazu Kde se berou texty snippetu? Title, URL Meta description Text stránky

SEO - Robot 1. krok je, aby se vaše stránka dostala do indexu. Přidání URL do hledání (na webu fulltextu) Jak pomoci robotům? Sitemap.xml Jak jim něco povolit a něco zakázat? Robots.txt Redirekty, 404, …

Black hat SEO Za účelem podvádět (spam) Skryté odkazy a texty MFA Doorway pages Link farmy Krádeže obsahu Další Hrozí penalizace.

SEO - báchorky Důležitost domény, URL Vyšší Srank znamená vyšší pozici ve výsledcích Validní stránky mají vyšší pozici … A co dál? Ptejte se.

Děkuji za pozornost.