Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Teorie zpracování dat Jana Šarmanová Radoslav Fasuga.

Podobné prezentace


Prezentace na téma: "Teorie zpracování dat Jana Šarmanová Radoslav Fasuga."— Transkript prezentace:

1 Teorie zpracování dat Jana Šarmanová Radoslav Fasuga

2 Literatura Šarmanová, J.: Teorie zpracování dat. Skriptum VŠB-TU, TZD_dist_i.PDF (CD - prodejna J257) G:\VYUKA\456\TZD\TZDi.PPT Date, C. J.: An Inproduction to Database Systems. 5th Edition, Reading, 1990 Pokorný, J.: Databázové systémy a jejich použití v informačních systémech. Academia Praha, 1992 Pokorný, J. - Halaška, I.: Databázové systémy, cvičení. Skriptum ČVUT Praha, 1994 Pokorný, J.: Databázová abeceda. Science, 1998

3 Video-přednášky

4 Teorie zpracování dat Určen pro: 2. ročník Bc. oboru PO 12:30-15:00 B5 Informační technologie PO 15:00-17:30 C3 Předpokládané znalosti: středoškolské - množiny, logika 1. řádu, programování v kterémkoliv jazyce Hodnocení: 3 x průběžný test 3 x 5 bodů program na zadané téma 15 bodů písemná zkouška 60 bodů ústní zkouška 10 bodů

5 Cíle předmětu Po absolvování předmětu student zná základní pojmy databázové technologie, umí je definovat, rozumí jim a na příkladech z reality je dovede vysvětlit, umí provést datovou analýzu navrhovaného informačního systému tak, aby výsledná struktura databáze měla optimální vlastnosti, umí vyhledávat jakékoliv informace z relační databáze v ní obsažené, a to jak procedurálně zformulováním vyhledávacího algoritmu, tak deskriptivně formulováním požadavků na vyhledávané informace, umí popsat metody fyzického ukládání informací v databázích, umí popsat principy ukládání informací a jejich vyhledávání v síťovém datovém modelu.

6 1.ZPRACOVÁNÍ DAT 1.1. Úlohy zpracování dat 1.2. Agendové zpracování dat 1.3. Databázové zpracování dat

7 Úlohy zpracování dat  Proč vzniká problém zpracování dat V praktickém životě je často zapotřebí evidovat údaje o nějaké skutečnosti.  o skupině lidí (zaměstnanců, studentů, členů sportovního oddílu ap.),  o zvířatech nebo rostlinách (evidence ZOO, botanické zahrady ap.),  o množině věcí (knihy ve veřejné knihovně, inventář firmy, materiálu na skladě ap.)  o množině jevů (počasí, provedených lékařských výkonech ap.) Zpracováním dat nazýváme evidování a zpracování velkého množství údajů o velkém množství objektů.

8 Úlohy zpracování dat  Co je úkolem zpracování dat Vést evidenci znamená  udržovat o takových souborech objektů přehled,  údaje mít vhodně uspořádány, aby se v nich údaje o dobře vyhledávaly, o v případě potřeby opravovaly a doplňovaly, o někdy počítaly údaje nové, z původních odvozené, o vytvářely různé výsledné přehledné tabulky apod.

9 Úlohy zpracování dat  Co a jak se zpracovává Objekty (lidi, zvířata, věci, jevy) popisujeme pomocí jejich vlastností. (zaměstnanec firmy má jméno, adresu, funkci, plat; kniha v knihovně má název, autora, rok vydání, cenu, …). Při evidencích se pak předem rozhodneme, které vlastnosti potřebujeme sledovat. Vybrané vlastnosti budeme nazývat atributy. I při „ručním“ zpracování si atributy pojmenujeme a zvolíme nějakou formu evidence. 1. Tabulka na papír či do sešitu nalinkujeme tabulku, sloupce popíšeme názvy vybraných evidovaných vlastností, celou tabulku pojmenujeme typem evidovaných objektů.

10 Úlohy zpracování dat Příklad 1: Evidence dat o zaměstnancích v tabulce. Zaměstnanci jsou zapisováni v pořadí, jak byli do firmy přijati. Potřebujeme evidovat jejich jméno, adresu, funkci, plat. Pojmenujeme tuto tabulku Zaměstnanec a její strukturu (= seznam evidovaných vlastností, atributů) zapíšeme takto: Zaměstnanec (jméno, adresa, funkce, plat) Tabulka vypadá takto: Zaměstnanec jménoadresafunkceplat Žižka KamilStudená 10, Ostrava 8svářeč12000 Bednářová PetraRůžová 12, Ostrava 1uklízečka 8000 … Novák FrantišekŠiroká 2, Opavaúčetní17000

11 Úlohy zpracování dat Nevýhody tabulkové formy Má-li tabulka již desítky řádků, je vyhledávání zdlouhavé (hledat se musí postupně shora dolů - sekvenčně). Při změnách hodnot údajů (slečna se provdá a změní jméno i adresu, úspěšný účetní dostane vyšší plat) se musí přepisovat údaje v políčkách tabulky, nebo celý řádek škrtnout a opsat dolů znovu. I při zrušení záznamů odchodu zaměstnanců vznikají vyškrtnuté řádky. Tabulka se stává nepřehlednou.

12 Úlohy zpracování dat 2. Kartotéka kartotéční listy, na každém je „formulář“ obsahující názvy evidovaných údajů. každý objekt je zapsán na jednu evidenční kartu, všechny listy jsou umístěny do krabice nebo šuplíku. Výhodou je možnost ukládat listy v nějakém uspořádání (zaměstnanci abecedně podle jména, knihy podle názvu nebo autora apod.) toto uspořádání dodržovat i při všech změnách, přidávání a rušení karet.

13 Úlohy zpracování dat Příklad 2: Evidence dat o zaměstnancích v kartotéce. Zaměstnanec jméno: Novák František adresa:Široká 2, Opava funkce:účetní plat:17000 Vyhledávání podle jména, pokud je kartotéka takto setříděna a hledající zná abecedu, je rychlejší. Ovšem vyhledání zaměstnanců s bydlištěm v Opavě znamená opět systematické procházení celou kartotékou.

14 Úlohy zpracování dat Zatím pojmy údaj (množné číslo ~ data) a informace bez přesnějšího rozlišení. Dále údaje či data budou skutečné hodnoty sledovaných atributů. Podle typu údaje to jsou čísla, časové údaje (datum a čas), texty (jména, názvy,..), logické hodnoty (ano/ne), případně další typy. Příklad 3: Údaje: (Novák František, 3, Novák Jiří, 12000, učitel) samy o sobě nám moc užitečné nejsou. Není jasné ani u obou jmen, čí jsou to jména – zaměstnanec a jeho syn, bratři sportovci …. O čísle se můžeme dohadovat, že jde o plat a o údaji učitel, že jde o zaměstnání, ale nevíme to jistě, ani ke komu se údaje vztahují. O čísle 3 se dokonce nemůžeme ani dohadovat, co znamená. Pokud však víme, že jde o údaje z evidence rodičů dětí se strukturou Rodič (jméno-žáka, postupný-ročník, jméno-otec, plat, povolání) jsou údaje srozumitelné.

15 Úlohy zpracování dat Shrnutí pojmů Daty nazýváme údaje získané měřením, pozorováním nebo jen pouhým zaznamenáním z reálné skutečnosti. Informace jsou smysluplné interpretace dat a vztahů mezi nimi. Zpracováním dat nebo také hromadným zpracováním dat nazýváme zpracování velkého množství údajů (obvykle desítky až stovky) o velkém množství objektů (obvykle od desítek po miliony i víc). Objektem nazýváme člověka, zvíře, věc nebo jev reálného světa, pokud se tito stali předmětem našeho zájmu z hlediska evidence. Objekt je popisován množinou svých vlastností. Objekty mají velké množství vlastností, ovšem z hlediska evidence potřebujeme sledovat jen některé z nich. Atributem nazveme údaj o objektu, který nás zajímá z hlediska evidence. Typem objektu budeme rozumět název množiny objektů a seznam jejich sledovaných atributů: Jméno-typu-objektu (atribut1, atribut2, …, atributn)

16 Úlohy zpracování dat Shrnutí pojmů Vést evidenci o objektech znamená zaznamenat vhodně organizované údaje na nějaké médium provádět změny údajů při změně evidované reality provádět výběry informací podle různých kritérií odvozovat a počítat z uložených údajů další třídit údaje dle různých kritérií zaznamenávat vztahy mezi údaji o objektech různých druhů o všech údajích zaznamenaných i odvozených vydávat informace ve vhodné grafické úpravě Informačním systémem obecně nazýváme organizaci údajů vhodnou pro systémové zpracování dat: pro jejich sběr, uložení a uchování, zpracování, vyhledávání a vydávání informací o nich, to vše pro účely rozhodování.

17 Úlohy zpracování dat Úlohy k řešení Firma potřebuje evidenci svých zaměstnanců, kde někteří pracují doma a výsledky práce firmě odevzdávají. Určete, které údaje se musí uchovávat, aby se mohly realizovat následující činnosti: podle zastávané funkce jim vyplácet pevnou mzdu a posílat ji na jejich účet v bance, měsíčně počítat počet zaměstnanců, vyplacenou sumu na mzdy, minimální, maximální a průměrnou mzdu, posílat odvody z mezd sociální a zdravotní pojišťovně, zdravotní pojišťovnu může mít každý zaměstnanec jinou, podle jazykových znalostí jim zadávat práci pro zahraniční zákazníky, podle vzdělání je posílat na specializovaná odborná jednání se zákazníky. Výsledek zapište pomocí typu objektu. 2. Najděte v praxi alespoň dalších 5 případů, kdy je zapotřebí dlouhodobě evidovat údaje o nějakém typu objektů. Zapište je jako typy sledovaných objektů. 3. Ke každé evidenci z úlohy 2 najděte alespoň 5 typů informací, které z evidence můžete získat. 4. Ke každé požadované informaci popište postup, jak se z dat získá.

18 1.2. Agendové zpracování dat Cíl Po prostudování tohoto odstavce budete umět  vyjmenovat výhody automatizovaného zpracování dat proti ruční evidenci  popsat realizaci automatizovaného zpracování dat v klasických programovacích jazycích  popsat problémy, které při tomto řešení vznikají a na příkladech z programátorské praxe vysvětlit jejich příčiny  uvést na příkladech výhody a nevýhody agendového zpracování dat  zdůvodnit, pro které úlohy s databází je výhodné i nyní použít klasický programovací jazyk

19 Agendové zpracování dat  Využití počítačů pro zpracování dat  Od historických dob prvních počítačů dodnes se úlohy evidence dat programovaly  v dostupných programovacích jazycích  na dostupných počítačích  většinou nešlo o jediný program, ale o sadu programů, řešících konkrétní úlohy – agendy  počátečním etapám úloh tohoto typu se říká agendové zpracování dat

20 Agendové zpracování dat  Historické agendové zpracování dat Původní agendy se zpracovávaly v dávkách  data se ručně zapisovala do formulářů  z formulářů na vstupní médium - mg. pásku, štítek, disketu  primární zpracování - data do počítače; přitom vstupní kontroly formální a částečně i logické správnosti dat, případně se provádí korekce dat; data jsou uložena na sekundární médium do vnější paměti počítače,  řadou sekundárních zpracování se pak nad daty provádějí potřebné výpočty, třídění, výběry, tisky sestav; obvykle aplikační programy řeší jednotlivé úlohy, soubor programů pak tvoří ucelenou agendu. Agendy obvykle řeší menší evidenční úlohy – jedna pro evidenci zaměstnanců, jiná pro majetek firmy, další pro sklad materiálu apod.;  často každá agenda v jiném programovacím jazyce, s vlastními daty.

21 Agendové zpracování dat  Závislost dat a programů  Každý program řeší nejen vlastní aplikační problém, ale i formát fyzického uložení dat na médiu.  Navazující úlohy musí respektovat již vytvořené – deklarované fyzické struktury dat.  Při změně datové struktury v jednom programu je nutné měnit a kompilovat i všechny další programy, které s touto strukturou pracují, i když se v jejich funkčnosti nic nemění.  Odtud nízká efektivnost datových struktur i programů.

22 Agendové zpracování dat  Problémy agendového zpracování  Redundance: některé informace ve více souborech opakují, jsou redundandní. Redundance je zdrojem mnoha dalších problémů  Konzistence: vzájemná shoda údajů. Postupem času - vlivem nedostatečné kontroly v programech se stejné hodnoty na různých místech v datových souborech, začnou rozcházet.  Integrita: data aktuální, odrážejí skutečnost z reálného světa.  Problémem tedy je zabezpečit, aby chybou či nedůsledností uživatele nebyla porušena integrita a konzistence dat.  Obtížná dosažitelnost dat: aplikační programy pro konkrétní požadavky; pro nový požadavek nutno napsat nový aplikační program - bez pomoci programátora nelze.  Izolovanost dat - data roztroušena v různých souborech, soubory mohou být různě organizovány, data různě formátována. To komplikuje tvorbu nových aplikačních programů a možnost realizovat vazby mezi datovými strukturami.

23 Agendové zpracování dat  Problémy agendového zpracování  Současný přístup více uživatelů: větší systémy vyžadují současný přístup k datům více uživatelů. Pak je nutné, aby programy vzájemně spolupracovaly, jejich činnosti byly koordinovány.  Ochrana proti zneužití: při zpracování důvěrných či tajných dat není přípustné, aby měl kdokoliv přístup ke všem informacím. Při klasickém zpracování však musí mít programátor aplikačních programů k dispozici tolik podrobností, že to ochranu dat prakticky znemožňuje.

24 1.3. Databázové zpracování dat Cíl Po prostudování tohoto odstavce budete umět  popsat důvody vzniku databázové technologie  formulovat paradigma databázové technologie  vysvětlit rozdíly mezi agendovým a databázovým zpracováním dat

25 Databázové zpracování dat  Poučení z agendového zpracování Zkušenosti ukázaly, že  všechny agendy používají jen několika málo typů údajů a několika málo typů operací s daty. Aplikační programy realizující jednotlivé úlohy a agendy se liší tím, v jakém pořadí a s kterými údaji tyto operace provádějí. Příklad Při evidenci zaměstnanců potřebujeme uložit atributy rodné číslo, jméno, datum nástupu, funkci, plat, procento daně, zda má řidičský průkaz, … Z hlediska datových typů to jsou čísla, texty, datumové údaje, logické údaje. Evidované údaje potřebujeme: kontrolovat jejich správnost při ukládání (RČ splňuje pravidla, funkce je ze známé množiny, plat odpovídá funkci, …), vyhledávat (podle jména, řidičáku, funkce, …), třídit (podle jména, data nástupu,, funkce, oddělení, …), dopočítávat (čistý plat z hrubého a daně, datum narození, věk či pohlaví z RČ, …), sčítat, průměrovat, … (suma platů pro výplatu, průměr platů za oddělení, firmu pro statistiky, …).

26 Databázové zpracování dat  Poučení z agendového zpracování Příklad Při evidenci materiálu na skladě potřebujeme ukládat jeho atributy: název, jednotkovou cenu, procento DPH, typ materiálu, množství na skladě, datum a množství příjmu a výdeje, pro kterou zakázku byl vydán, zda je materiál volně k prodeji, … Z hlediska datových typů to jsou opět čísla, texty, datumové údaje, logické údaje. Evidované údaje potřebujeme: kontrolovat jejich správnost při ukládání (množství přijaté je kladné, typ je ze známé množiny, DPH odpovídá zákonu, …), vyhledávat (podle názvu typu, …), třídit (podle názvu, typu, data výdeje, zakázky, …), dopočítávat (celková cena z jednotkové a množství, cena včetně DPH, …), sčítat, průměrovat, … (suma za sklad, suma za zakázku, průměr cen za zakázky pro statistiky, …).

27 Databázové zpracování dat  Poučení z agendového zpracování To vedlo k návrhu a vytvoření programových systémů (systémů řízení báze dat – SŘBD) následujících vlastností:  existuje seznam datových typů, které jsou v programovém systému definovány; pro tyto typy dat programový systém vytváří fyzickou strukturu na disku a automaticky řeší všechny přístupy k datům  existují prostředky pro definování všech sledovaných vlastností popisovaných objektů;  existuje soubor instrukcí, které nad definovanými daty provádějí jednotlivé operace; každá instrukce je vlastně mohutnou procedurou, v níž je řešen fyzický přístup k datům i realizace vlastní operace; jinak než prostřednictvím systému není možno s daty pracovat;  programový systém řeší způsob, jak zaznamenat vztahy mezi objekty.

28 Databázové zpracování dat  Základní pojmy databázového zpracování Atribut  Formálně je popsán svým názvem (identifikátorem) a datovým typem, v programovacím jazyce je realizován položkou (proměnnou) - logicky dále nedělitelnou jednotkou ve struktuře dat. Definování datových typů souvisí s programovacím prostředím.  Někdy není atribut jednoduchý, ale může se několikrát opakovat a pak mu říkáme multiatribut. Realizován je buď polem (array) – položka se opakuje daný počet-krát, nebo jinak, pokud se opakuje předem neznámý počet krát.  Některý atribut není jednoduchý, ale skládá se z několika položek obecně různého typu. Pak jej nazýváme skupinovou položkou (record).

29 Databázové zpracování dat  Základní pojmy databázového zpracování Atribut Příklad V následujícím typu objektu Zaměstnanec ( jméno (křestní, příjmení, titul), adresa (ulice, obec, PSČ), vzdělání: multi, …) jsou jméno a adresa skupinové položky, vzdělání opakující se položka neznámý počet-krát.  Při výběru typu položky se rozhodujeme pro ten datový typ, který nejlépe a přitom nejúsporněji z hlediska uložení i zpracování dat zaznamená daný údaj. Položky zaznamenávají jednotlivé údaje o objektu.

30 Databázové zpracování dat  Základní pojmy databázového zpracování Entita - objekt  celá posloupnost položek popisuje objekt. Taková struktura položek, která má ucelený význam (zachycuje všechny potřebné údaje o sledovaném objektu) se nazývá záznamem (větou, recordem). Je to obvykle skupinová položka. Množina entit – množina objektů – datový soubor – obsah tabulky  množinu záznamů stejného typu, zaznamenávající ucelenou informaci o množině sledovaných objektů a uloženou na paměťovém médiu, nazýváme datovým souborem. Množiny záznamů si můžeme snadno představit ve tvaru tabulky, kde každý objekt je popsán jedním řádkem a každý atribut objektu je v jednom sloupci. Databáze  Množinu datových souborů, uchovávajících data o nějakém uceleném úseku reality, nazýváme databází.

31 Databázové zpracování dat  Základní pojmy databázového zpracování Systém řízení báze dat - SŘBD  programový systém (prázdný, bez datových souborů a bez aplikačních programů), umožňující definování datových struktur a datových souborů, řešící fyzické uložení dat ve vnější paměti počítače, umožňující manipulaci s daty a formátování vstupních i výstupních informací, nazýváme systémem řízení báze dat. Aplikační úloha  Aplikační úlohou nad SŘBD nazýváme konkrétní program napsaný pomocí programových prostředků použitého SŘBD nad konkrétní databází, pro tuto úlohu vytvořenou.

32 Databázové zpracování dat  Základní pojmy databázového zpracování Informační systém  Aplikační úlohy nad společnou databází tvoří ucelený systém, nazývaný databázovým nebo informačním systémem (dále jen IS) nad použitým SŘBD.  V tomto pojetí tedy informačním systémem rozumíme celek, řešící rozsáhlejší oblast aplikační, naprogramovaný v jednom SŘBD s vhodně navrženými datovými strukturami tak, aby všechny aplikační úlohy k nim měly optimální přístup. Řeší uložení, uchování, zpracování a vyhledávání informací a umožňuje jejich formátování do uživatelsky přívětivého tvaru.

33 Databázové zpracování dat  Základní pojmy databázového zpracování Příklad SŘBD existuje mnoho, z nejznámějších např. MS Access, Visual FoxPro, … Oracle, MS SQL Server, … Některé z nich jsou určeny pro databáze menších rozsahů a informační systémy nad databází pracující s menším počtem uživatelů. Jiné jsou velké (taky drahé) a zvládají jak rozsáhlé databáze (statisíce i miliony záznamů), tak vysoký počet uživatelů (stovky, tisíce, …). Poznámka: Někdy se v programátorském žargonu zkráceně místo SŘBD říká „databáze“. Není to přesné a zatím se budeme držet přesně zavedených pojmů.

34 Databázové zpracování dat  Paradigma databázové technologie  Definování datových typů a operací nad daty není vše, čím se liší databázová technologie od klasického programování.  Nejpodstatnější rozdíl, základní princip či tzv. paradigma databázové technologie je oddělení datových struktur od programů  Tuto vlastnost zabezpečuje v SŘBD možnost definovat datové a programové struktury samostatně a nezávisle na sobě. Struktury datových souborů jsou uloženy samostatně nebo jsou součástí datových souborů. Programy s nimi pracují tak, že si načtou strukturu dat a pak s datovým souborem mohou provádět potřebné operace. Při změně datové struktury není nutné měnit programy, při změně programů není nutné měnit datové struktury.

35 Databázové zpracování dat  Paradigma databázové technologie Pascal: Program Evidence_zamestnancu; var Zamestnanec: record of jmeno: string [1..20]; adresa:string [1..50]; funkce:string [1..10]; plat: integer end; Begin... End. program data deklarace

36 Databázové zpracování dat  Paradigma databázové technologie SŘBD: CREATE TABLE Zamestnanec (jmeno CHAR(20), adresa CHAR(50), funkce CHAR(10), plat NUMBER(8,2)); program Zamestnanec deklarace use Zamestnanec data


Stáhnout ppt "Teorie zpracování dat Jana Šarmanová Radoslav Fasuga."

Podobné prezentace


Reklamy Google