DOK. NĚCO K IMPLEMENTACI … Dokumentografické informační systémy IRS musí parcovat s velmi rozsáhlými ale velmi řídkými maticemi.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Algoritmy zpracování textů II
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
Dualita úloh lineárního programování a analýza citlivosti
MARKOVSKÉ ŘETĚZCE.
Počítače a programování 1 Přednáška 13 Jiří Šebesta.
Implementace ICT do výuky č. CZ.1.07/1.1.02/ GG OP VK Studijní obor: Sociální činnost Ročník: 2 Počítačová grafika.
Programování funkcí v Excelu (pole)
MATLAB LEKCE 7.
SEO pro novou firmu Bartošová Lenka 3MA
Dajbych Václav Pole Další stránku vyvoláte levým kliknutím na Vaší myš, nebo popřípadě rolovacím kolečkem.
Ústřední knihovna FSS MU ÚK FSS MU, místnost 1.30, Martin Krčál Sociální sítě sdílejte, komunikujte a spolupracujte online.
Multi-dimensional Sparse Matrix Storage J. Dvorský, M. Krátký, Katedra informatiky, VŠB – Technická univerzita.
Architektury a techniky DS Tvorba efektivních příkazů I Přednáška č. 3 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Školení internetového vyhledávače. Co je to internetový vyhledávač Aplikace na internetu,která dokáže podle klíčového slova najít internetovou.
Manažerské informační systémy Ing. Dagmar Řešetková
Vyhledávání na Internetu
Kód UT ISI. Číslo UT ISI se zobrazuje pouze v exportních formátech Web of Science:Číslo UT ISI se zobrazuje pouze v exportních formátech Web of Science:
Algoritmy I Cvičení č. 4.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Světlana Filipová. Materiál zpracován v rámci projektu Implementace ICT techniky do výuky.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
DOK.
Robustní vyrovnání Věra Pavlíčková, únor 2014.
ALGORITMIZACE ÚVODNÍ PŘEDNÁŠKA 2 SLOVO ALGORITMUS VZNIKLO ZE JMÉNA ARABSKÉHO MATEMATIKA AL-KHWARIZMIHO, KTERÝ V DEVÁTÉM STOLETÍ SEPSAL ROZSÁHLOU KOLEKCI.
1 Vyhledávání Principy vyhledávání Klasifikace klíče:  Interní klíč – je součástí prohlížených záznamů  Externí klíč – není jeho součástí, je jím např.
Informatika pro ekonomy II přednáška 1
Řadicí algoritmy autor: Tadeáš Berkman.
 př. 7 výsledek postup řešení Vypočti velikost obsah trojúhelníku ABC. A[-2;1;3], B[0;1;3], C[-2;1;-1]
doc. RNDr. Zdeněk Botek, CSc.
EKO/GISO – Modely prostorových dat.  Mnoho definic - jedno mají společné – Gisy pracují s prostorovými daty  Minimální GIS vždy spojuje databázi, prostorové.
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
Neuronové sítě Martin Vavřička Copyright 2004 © Martin Vavřička 2004 – V 53 ČVUT v Praze – fakulta Stavební.
PB161 – Programování v jazyce C++ Objektově Orientované Programování
Algoritmy a programovací techniky
Algoritmy vyhledávání a řazení
Počítačová grafika.
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Časová složitost algoritmů, řazení a vyhledávání
Časová složitost algoritmů
EBSCOhost Collection Manager ~ Vytváření profilů Tutoriál support.ebsco.com.
Sorty Bubble, Insert a Quick
Elektronická učebnice - II
C# - Generic Collections Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí.
Získávání informací z webu (Information Retrieval on the Web)
Kompresní algoritmus LZW Dokumentografické informační systémy.
Směrování - OSPF.
Podnikání na Internetu internet - zdroj informací Letní semestr 2005 Jana Holá III.
Databázové systémy Přednáška č. 5 Datové typy a Fyzická organizace dat.
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK 4. Mapování a redukce dimenze 1. část – úvod + mapování vektorových sad.
př. 6 výsledek postup řešení
MIS - Manažerské informační systémy 1. cvičení – Internet a informace
Hypertextové odkazy [cit ]. Dostupné pod licencí Public Domain – na
Nikola Dynybylová Jediný a jedinečný Sage ÚK FSS MU, Ústřední knihovna FSS MU.
OSNOVA: a) Ukazatel b) Pole a ukazatel c) Pole ukazatelů d) Příklady Jiří Šebesta Ústav radioelektroniky, FEKT VUT v Brně Počítače a programování 1 pro.
14. června 2004Michal Ševčenko Architektura softwarového systému DYNAST Michal Ševčenko VIC ČVUT.
TOMÁŠ RUPRICH E-TECHNOLOGIE LS 2008/09 Google hacking.
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Studijní informační zdroje (a jak se k nim dostat) Osnova Prezentace.
Prostorové datové struktury
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
BioTech 2011, Strážná. O čem to bude? Stochastické simulace Diferenciální rovnice (ODR) Automaty.
11/2003Přednáška č. 41 Regulace výpočtu modelu Předmět: Modelování v řízení MR 11 (Počítačová podpora) Obor C, Modul M8 ZS, 2003, K126 EKO Předn./Cvič.:
Metrické indexování vektorových modelů v oblasti Information Retrieval
PROGRAMOVÁNÍ 3ITA,3ITB Jaroslav Burdys Hlavní zdroj:
C-síť (circle – net) Petr Kolman.
Vzorové řešení zápočtového testu
Ukládání dat v paměti počítače
Fulltextové vyhledávání
Informatika pro ekonomy přednáška 3
Informatika pro ekonomy přednáška 3
Transkript prezentace:

DOK

NĚCO K IMPLEMENTACI …

Dokumentografické informační systémy IRS musí parcovat s velmi rozsáhlými ale velmi řídkými maticemi

Řídká matice/vektor Obsahuje převážně nuly (nulový prvek) Implementace dvojrozměrným polem je tudíž dost luxus – 100k x 1M double (8B) by bylo 800GB? Mnoho formátů – Časová složitost je cenou za prostorové úspory

Uložení řídké matice Viz wikipedia Dictionary of keys (DOK) – Pro nenulové prvky si pamatuji (row, column)->value List of lists (LIL) – Seznam seznamů Coordinate list (COO) – Trojice (value, row, column) Yale format + varianty

Námět k implementaci Intuitivní formáty/algoritmy – Řídký vektor Uložíme vektor formou (souřadnice,value), jak to efektivně naimplementovat? Vyhledávání/čtení, vkládání – Řídká matice Nějaký popsaný algoritmus Intuitivně – jako pole řídkých vektorů Na začátku quicksort, binary search pro vyhledávání, binarní vkládání do setřízené posloupnosti Cílem je implementace bez pomoci knihoven (STL, Collections etc.) int [] index double [] hodnota131246

OPAKOVÁNÍ Z PŘEDNÁŠEK…

Vyhledávání na Webu On-page informace plus off-page informace – Využití různých ‘chytrých’ algoritmů – Neuronky atd. PageRank (Google) – Pro každý dokument skóre PR HITS – 2 míry, Authority & HUB RankNet (Bing) – Neuronová síť usuzuje z vlastností dokumentů na jejich rank – bing-works.html

HITS Hyperlink Induced Topic Search 2 kategorie dokumentů – Autority (authorities) Je odkazována mnoha dalšími – Huby (hubs) Odkazuje mnoho dalších Předpoklad – Kvalitní huby odkazují kvalitní autority

HITS Vyhledávání – Keyword search – Rozšíří result set o dokumenty, které linkují vyhledané a které jsou odkazovány z vyhledaných (neighborhood graph) – Zredukuje velikost, iterativně spočítá míry – Přeorganizuje dokumenty

PageRank Inspirován bibliometrickými algoritmy Random surfer model – Začne na náhodném dokumentu – Buď klikne na link nebo (s pravděpodobností d) se ‘teleportuje’ na libovolný dokument v kolekci Každému dokumentu přiřazuje PR – ‘PR dokumentu je dán PR dokumentů, které jej odkazují

PageRank Výpočet – Iterativně (na začátku malé náhodné hodnoty, pak několik iterací výpočtu) – NEBO jako eigenvector Google matice G

PageRank

RankNet Založen na neuronových sítích

RankNet Jako každou neuronku museli RN nejdříve naučit – Udělali to dobře? Poté dokumenty řadí