DSMS Martin Schmid Dotazovací Jazyky 11.2011. Co je to DSMS? ● Data Streaming Management System ● Ale co je to stream? ● Proud dat setříděných podle času.

Slides:



Advertisements
Podobné prezentace
Kuchařka na práci s mnohočleny Matematika pro ZŠ Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je David Salač. Dostupné z Metodického portálu.
Advertisements

Kalkulace S tudent. Osnova výkladu 1.Kalkulace nákladů a způsoby jejího rozlišení 2.Kalkulační vzorec nákladů 3.Stanovení nákladů na kalkulační jednici.
CorelDRAW – dodatky (19). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
Tabulkový procesor Formuláře – interaktivní prvky v Excelu Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Růžena Hynková. Dostupné z Metodického.
Odborný výcvik ve 3. tisíciletí Tato prezentace byla vytvořena v rámci projektu.
Základní škola a Střední škola CREDO, o.p.s. Číslo projektu: CZ.1.07/1.4.00/ Výukový materiál č.: VY_32_INOVACE_107_Nebezpečí elektřiny Vypracoval:
Systém správy dokumentace akreditované zkušební laboratoře Bc. Jan Randl, 4912.
Základní škola a Mateřská škola, Liberec, Barvířská 38/6, příspěvková organizace Název : VY_32_inovace_18 Informatika - MS Excel – Typy grafů Autor: Pavlína.
CZ.1.07/1.4.00/ "Učíme se moderně" Digitální učební materiál zpracovaný v rámci projektu Šablona:III/2 Inovace a zkvalitnění výuky prostřednictvím.
Dopravní modely v SUMP Jitka Ondráčková
Databáze © Mgr. Petr Loskot
Úvod do databází MS Access (1).
Seminář o stavebním spoření
Databázové systémy I Přednáška 7 Databázové systémy 1 – KIT/IDAS1
SLOVNÍ ÚLOHY ŘEŠENÉ ROVNICEMI.
POHYB.
Vytvořil: Robert Döring
ČAS.
Slovní úlohy o společné práci
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
DUM:VY_32_INOVACE_IX_1_17 Výkon Šablona číslo: IX Sada číslo: I
Návod na tvorbu prezentace diplomové / bakalářské práce
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu
Evaluace předmětů studenty (Anketky)
Lineární funkce - příklady
Řešení nerovnic Lineární nerovnice
Základní pojmy v automatizační technice
ORGANIZACE DAT V POČÍTAČI
Základní škola a Mateřská škola Bílá Třemešná, okres Trutnov
Vedoucí odboru strategického rozvoje města Vsetín
Digitální učební materiál zpracovaný v rámci projektu
8.1.2 Podprostory.
Název školy Základní škola Jičín, Husova 170 Číslo projektu
Vytvoření databázového dotazu z více tabulek
Běžné reprezentace grafu
2. seminární úkol - projekt
Obchodní akademie, Střední odborná škola a Jazyková škola s právem státní jazykové zkoušky, Hradec Králové Autor: Mgr. Lubomíra Moravcová Název materiálu:
Management Přednáška 7, 8: Plánování.
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Kvadratické nerovnice
Slovní úlohy o společné práci stejný čas
Autor: Mgr. Jitka Šteflová Název: VY_12_INOVACE_14_Teplota a čas
Řešení nerovnic Lineární nerovnice
BIBS Informatika pro ekonomy přednáška 2
Slovní úlohy o pohybu Pohyby stejným směrem..
Rovnice s absolutními hodnotami
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Microsoft Office Access
Slovní úlohy o společné práci
Jiří Vyskočil, Marko Genyg-Berezovskyj 2010
Algebraické výrazy: lomené výrazy
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně
A5M33IZS – Informační a znalostní systémy
Slovní úlohy o společné práci
Algoritmizace a datové struktury (14ASD)
Přednáška 6 SQL – spojení tabulek.
Lomené výrazy (2) Podmínky řešitelnost
NÁZEV ŠKOLY: Základní škola a Mateřská škola Nedvědice, okres Brno – venkov, příspěvková organizace AUTOR: Jiří Toman NÁZEV: VY_32_INOVACE_06_19 Fyzika,
Lineární funkce v praxi
Modely obnovy stárnoucího zařízení
Informatika – Průměr a min-max
Hra (AZ kvíz) ke zopakování či procvičení učiva:
AUTOR: Blanka Petlánová NÁZEV: VY_32_INOVACE_Pr3_08_Určování času
Příklady - opakování Auto se pohybovalo 3 hodiny stálou rychlostí 80 km/h, poté 2 hodiny rychlostí 100 km/h, pak 30 minut stálo a nakonec 2,5 hodiny rychlostí.
Grafy kvadratických funkcí
Seminář o stavebním spoření
Teorie chyb a vyrovnávací počet 2
Komunitní navigace Waze
Slovní úlohy o společné práci − 3
Tečné a normálové zrychlení
Transkript prezentace:

DSMS Martin Schmid Dotazovací Jazyky

Co je to DSMS? ● Data Streaming Management System ● Ale co je to stream? ● Proud dat setříděných podle času ● Měření teploty, informace o obyvatelých (věk, plat) ● Informace o dopravě (počet aut, nehody) ● Televizní vysílání, telefonní hovory ● Seřažené n-tice (a, T) podle času, kde a je prvek relace a T časové razítko. – (teplota, místo, T) – (id_auta, pozice_auta, rychlost, T)

Co by nás mohlo zajímat ● Průměrný/maximální věk/plat obyvatel ● Počet aut na D1 ● Průměrná rychlost na komunikacích ● Počet nehod za poslední týden ● Graf vývoje teplot

Proč nepoužít DBMS? ● Určitě dokážeme zjistit maximální věk či průměrný plat ● Také si spočítáme počet aut na dálnici, počet nehod ● Data se ale RYCHLE MĚNÍ ● (lidé umírají, auta bourají) ● Nechceme pouštět dotaz pořád dokola – dotaz navíc může trvat dlouho ● Někdy je dat příliš mnoho, aby jsme je dokázali ukládat

Limitace DBMS pro proudy ● DBMS je pasivní skladiště dat, kde lidé spouštějí dotazy. ● (Human-Active, DBMS-Passive (HADP) model) ● Zajímá nás pouze současný stav dat (a né jak se data v čase měnila) ● Triggery byli navrženy až později a jejich implementace není dost rychlá pokud je jich potřeba mnoho. ● DBMS předpokládá, že data všechna data jsou synchronizovaná a v konzistentním stavu => dotazy mají vždy přesnou, správnou odpověď ● DBMSs není navrženo pro real-time aplikace

Vlastnosti DSMS ● Místo trvalých relací, DSMS pracuje s daty které mohou do sýtému přitékat a zase odtékat ● Výsledek dotazu není statický ● Nemusíme nutně ukládat celý proud, ale stačí data potřebné pro okénko dotazu ● Real time vlastnosti důležitější než přesnost (I za cenu zahození dat které nestíháme zpracovat) ● Některé DSMS integrují DBMS a umožnují například join tabulka + stream

Linear Road Benchmark ● Jak velké množství dat/s je schopen DSMS zvládat ● Na jaké otázky je nám schopen vůbec odpovědět ● Nejedná se čistě o papírový příklad – využití v navigacích ● Simulace dopravního zatížení několika rychlostních silnic ● Regulace dopravy je zarízena pomocí měnících se poplatků za úseky jednotlivých úseků silnic ● Každá z L dálnic je dlouhá 100 mil a rozdělena do sta jednomílových segmentů. ● Dálnice jsou 4-proudové, kde jedna je vyhrazena pro vstup/výstup ● Auta hlásí svoji pozici v 30s intervalech. Auta musí být informována o poplatcích pro segment v kterém se nachází. ● Pokud auta nahlasí shodnou pozici 4krát za sebou, jedná se o nehodu

Linear Road Benchmark Co od tohoto systému požadujeme? ● Počet aut ● Kolik jsme vybrali za poplatky – celkem, dnes, dnes na konkrétní dálníci... ● Očekávaná doba cesty ● Na jak velkých datech? ● 12 milionů hlášení pozic

DSMS ● Výsledek dotaz se v průběhu času mění ● Výsledkem může být nekonečná množina

Struktura dotazů ● Chceme podobnou syntax jako v SQL ● Dotazy používají OKNO, a to buď – Časové (počet aut co projelo za poslední hodinu) – Relační (průměrná rychlost posledních 100 aut) ● Kdy se mají dotazy aktualizovat? – Na základě časových jednotek (v čase 186 přijela auta A, B, C) – Na základě jednotlivých záznamů (v čase 186 přijelo auto A, v čase 186 přijelo auto B, v čase 186 přijelo auto C)

Co budeme používat ● Aukce(id_aukce, pradavac, T) ● Nakup(id_aukce, kupujici, cena, T)

CQL ● Continuous Query Language ● Dotazy jsou aktualizovány na základě času

CQL ● Kolik utratil Luke na aukcich od Johna za posledni den? ● SELECT SUM(P.cena) ● FROM Aukce AS A, Nakupy [RANGE 1 DAY] AS P ● WHERE A.id_aukce = P.id_aukce ● AND A.prodavac = 'John' ● AND P.kupujici = 'Luke'

CQL ● Kolik utratil Luke za poslednich 10 aukcich od Johna? ● SELECT SUM(P.cena) ● FROM Aukce AS A, Nakupy [ROWS 10] AS P ● WHERE A.id_aukce = P.id_aukce ● AND A.prodavac = 'John' ● AND P.kupujici = 'Luke'

CQL ● V předchozích případech byl výsledek aktualizovaná relace – Stream-to-relation dotazy ● Co když ale chceme aby výsledek byl opět proud? – Stream-to-stream ● Nejrychlejší auto za posledních 10minut – Nechceme pouze pouze auto, ale postupně aktualizovaný proud aut, která byla nejrychlejší – Do proudu je vždy vloženo nové ● => ● ISTREAM operator ● ISTREAM( DOTAZ ) postupně plní proud z dotazu

STREAM implementace ● WHERE pro sub-query ● HAVING ● Aritmetika v agregaci (MAX(A) – MIN(B) AS X) ● Padá často na agregacích MIN, MAX ● !!Data musí být nejprve uložena do souboru => není vůbec hotová podpora real-time!! ● (May 2011)

StreamSQL ● Podobná syntax jako CQL ● Narozdíl od CQL má syntax pro stream-to-stream

Stream-to-stream operators ● Stream FILTER ● SELECT * FROM Nakupy WHERE cena > 100 ● Stream JOIN ● SELECT * FROM A, B ● WHERE A.id = B.id

Stream-to-stream operators ● Stream UNION – slije dva proudy do jednoho na základě času ● ceske_aukce(aukce, T) ● slovenske_aukce(aukce, T) ● SELECT * FROM ceske_aukce UNION slovenske_aukce ● (ces.aukce, 2), ● (slov.aukce, 3) ● (slov.aukce, 5) ● (ces.aukce, 8) ● (ces.aukce, 9)

Linear Road Benchmark ●

Sledování ptáků

Otázky? ● Děkuji za pozornost...