Návrh struktury - normalizace

Slides:



Advertisements
Podobné prezentace
Normalizace Řada analytiků se mylně domnívá, že pro každý objekt existuje jedno jediné univerzálně použitelné nejlepší řešení bez ohledu na řešený problém.
Advertisements

Jan Tichava Zdroj:
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Ing. Monika Šimková. Máme-li data reprezentovat v databázi, jak vybereme jejich strukturu na konceptuální úrovni? Konceptuální modelování analyzuje požadavky.
Business intelligence
Aplikační a programové vybavení
Databázové systémy Přednáška č. 3 Proces návrhu databáze.
A5M33IZS – Informační a znalostní systémy Normální formy.
Pojmy z ERD.
Výpočetní technika Akademický rok 2006/2007 Letní semestr Mgr. Petr Novák Katedra informatiky a geoinformatiky FŽP UJEP
Databázové systémy Relační model.
Teorie zpracování dat Ukázková písemka. Kapitola 4 Je dána tabulka Zam (login, jmeno, plat, funkce), implementovaná je v SŘBD používajícím indexové soubory.
YDASYS Ing. Monika Šimková.
Databáze. Návrh Není to legrace a pro kvalitní databázi je nutné věnovat řadě věcem čas a je nutné použít i papír a tužku!!! Co je to databáze?
Relační datový model Základní ideje
1IT Relační datový model
Úvod do databázových systémů
8 Výpočetní technika Ing. Jan Popelka, Ph.D. odborný asistent
Databáze Jiří Kalousek.
Konceptuální datové modelování
Cvičení 13 Ing. Pavel Bednář
Databázové systémy Štěpán Šípal.
Návrh Databází Štěpán Šípal.
KONCEPTUÁLNÍ MODELOVÁNÍ
DATOVÉ MODELY (c) Tralvex Yeap. All Rights Reserved.
Databázové systémy přednáška+cvičení
Fakulta elektrotechniky a informatiky
Relační databáze.
1IT D OTAZOVACÍ JAZYKY V RELAČNÍCH DATABÁZÍCH Ing. Jiří Šilhán.
Normalizace.
Konceptuální návrh databáze
Informatika pro ekonomy II přednáška 10
Úvod do databázových systémů
Databázové systémy Přednáška č. 4 Proces návrhu databáze.
Úvod do databází Ing. Tomáš Rain 10. dubna 2017.
Teorie zpracování dat KONCEPTUÁLNÍ SCHÉMA.
Databázové systémy Přednáška č. 4.
Konceptuální návrh databáze
Teorie zpracování dat Návrh struktury databáze Funkční závislosti
Databázové modelování
Databázové systémy Relační model.
Databázové modelování
Úvod do databázových systémů
Databázové systémy Informatika pro ekonomy, př. 18.
Informační systémy 1.
Seminář pro studenty BIVŠ
Aplikační a programové vybavení
Normalizace v objektových databázích Vojtěch Merunka
Alexandra Sekničková Tvorba comba v pohledech. Úkol: n Vytvořte pro firmu Hurá, a. s. databázi všech jejich pracovníků.
Databázové systémy Datové modely.
Univerzita třetího věku kurz Znalci Databáze 1.
Databázové systémy Normalizace dat.
P114_21 P114 Klasické metody modelování RDM, ERAM 2.
Úvod do databází zkrácená verze.
● Databaze je soubor dat,slouží pro popis reálného světa(např.evidence čkolní knihovny..) ● Relační databaze je databáze založená na relačním modelu.
Úvod do databázových systémů
Databázové systémy přednáška 4 – ERD
Relační databázová technologie
Výpočetní technika Akademický rok 2008/2009 Letní semestr
Z3104 Geodatabáze úvod.
Databázové systémy 1 – KIT/IDAS1 Ing. Monika Borkovcová, Ph.D.
Z3104 Geodatabáze úvod.
Informatika pro ekonomy přednáška 8
Normální formy Projekt OBZORY
Počítačová cvičení z předmětu Datové sklady #1 Relační model dat
FUNKČNÉ ZÁVISLOSTI A NORMALIZÁCIA PRE RELAČNÉ DATABÁZY
Přednáška 3 Normalizace databáze.
Databázové systémy Normální formy.
Databázové systémy UIN010
A5M33IZS – Informační a znalostní systémy
Transkript prezentace:

Návrh struktury - normalizace Databázové systémy Návrh struktury - normalizace

Návrh struktury databáze Proces návrhu databáze založený na teorii závislostí se nazývá normalizace. - dekompozice dat na jednotlivé tabulky a určení vztahů mezi nimi Problémy špatného návrhu databáze Opakující se informace (redundance) Nemožnost reprezentovat určitou informaci Ztráta informace Složitá kontrola integritních omezení

Funkční závislost X → Y Plná funkční závislost Hodnota atributu relace určuje jednoznačně hodnotu jiného atributu stejné relace X → Y Klient(r_cislo,jmeno,prijmeni,ulice,mesto) Hodnota rodneho cisla jednoznacne určuje hodnoty dalších atributů r_cislo→(jmeno,prijmeni,ulice,mesto) jmeno→(prijmeni,ulice,mesto) Plná funkční závislost Atribut je funkčně závislý na celém složeném atributu a ne jen na některé jeho části.

Tranzitivní závislost Atribut je funkčně závislý na jiném funkčně závislém atributu Ucet(c_uctu,r_cislo,stav,jmeno) Vícehodnotová závislost - multizávislost Hodnota atributu relace určuje jednoznačně množinu hodnot jiného atributu stejné relace nezávisle na hodnotách ostatních atributů. Ucet - r_cislo značí vlastníka účtu, klent ale může mít více adres

Normalizace Potřebné vlastnosti dekompozice - postupná dekompozice dat – transformace tabulky do vhodnějšího tvaru Potřebné vlastnosti dekompozice bezztrátovost při zpětném spojení zachování závislostí odstranění opakování - redundance Bezztrátová dekompozice - spojení tabulek, které vzniknou dekompozicí musí dát přesně původní tabulku

Zachování závislostí - všechny původní závislosti musí být zachovány a snadno kontrolovatelné r_cislo c_uctu stav pobocka jmeni r_cislo c_uctu stav c_uctu pobocka jmeni

Odstranění opakování c_uctu stav pobocka jmeni 4568517 42000 Zarámí 4463 5000000 6585485 75000 T.Bati 2132 8000000 3256151 25000 T.Bati 2132 8000000 ÚČET: POBOČKA: c_uctu stav pobocka nazev jmeni 4568517 42000 Zarámí 4463 T.Bati 2132 5000000 6585485 75000 T.Bati 2132 Zarámí 4463 8000000 3256151 25000 T.Bati 2132

Normální formy - definují požadavky na vlastnosti schématu tabulky z pohledu závislosti mezi atributy Hierarchie normálních forem 1.NF až 3.NF BCNF – (Boyce-Coddova) 4.NF a 5.NF PLATÍ: n-tá normální forma musí splňovat podmínky n-1 normální formy a ještě něco navíc.

1. normální forma – 1NF Tabulka je v první normální formě, právě když všechny její atributy jsou atomické, tj. dále již nedělitelné. Klient JMÉNO PŘÍJMENÍ BYDLIŠTĚ jan novák Ostravská 16, Praha16000 petr nový Svitavská 8, Brno61400 nováček Na bradlech 1147, Ostrava 79002 Správný návrh tabulky, který bude respektovat 1NF bude vypadat následovně: JMÉNO PŘÍJMENÍ ULICE ČÍSLO MĚSTO PSČ jan novák Ostravská 16 Praha 16000 petr nový Svitavská 8 Brno 61400 nováček Na bradlech 1147 Ostrava 79002

2. normální forma – 2NF Tabulka je ve druhé normální formě, právě když splňuje 1NF a navíc každý její neklíčový atribut, je plně funkčně závislý na každém kandidátním klíči. (Tzn. problém 2NF se týká jenom tabulek, kde volíme za primární klíč více položek než jednu.) Ucet1 c_uctu r_cislo stav pobocka jmeni Ucet2 Disponuje c_uctu stav pobocka jmeni r_cislo 4568517 42000 Zarámí 4463 5000000 826111/5267 6585485 75000 T.Bati 2132 8000000 580506/4891 3256151 25000 601012/1224

3. normální forma – 3NF Tabulka je ve třetí normální formě, jestliže je v 2NF a neexistuje žádný neklíčový atribut, který je tranzitivně závislý na některém kandidátním klíči. Ucet1 c_uctu r_cislo stav pobocka jmeni Ucet2 Disponuje c_uctu stav pobocka jmeni r_cislo Ucet3 Disponuje Pobočka c_uctu stav pobocka r_cislo jmeni c_uctu stav pobocka jmeni 4568517 42000 Zarámí 4463 T.Bati 2132 8000000 6585485 75000 5000000 3256151 25000

Boyce-Coddova normální forma Tabulka je v BCNF, jestliže pro každou netriviální funkční závislost X → Y je X superklíčem. - může existovat několik kandidátních klíčů. - kandidátní klíče můžou být složené, - kandidátní klíče se můžou překrývat - 3NF připouší tranzitivní závislosti mezi klíč. atributy Disponuje(r_cislo,c_zakaznika,c_uctu)

4. normální forma – 4NF 5. normální forma – 5NF Tabulka je ve čtvrté normální formě, jestliže pro každou netriviální vícehodnotovou závislost X Y je X superklíčem. Čtvrtá normální forma v podstatě říká, že vícehodnotové závislosti musíme vyčlenit do samostatné tabulky. 5. normální forma – 5NF Tabulka je v páté normální formě, jestliže pro každou netriviální netriviální závislost na spojení je každá množina atributů superklíčem.

Transformace ER diagramu na tabulky relační databáze Hlavní problémy špatného návrhu: opakující se informace (redundance) nemožnost reprezentovat určitou informaci - složitá kontrola integritních omezení

Pravidla transformace Odstranění složených a vícehodnotových atributů (převod do 1NF) Vícehodnotový atribut → slabá entitní množina nebo náhrada pevným počtem opakování

Pravidla transformace Reprezentace silné entitní množiny Reprezentace slabé entitní množiny

Pravidla transformace Reprezentace vztahů

Pravidla transformace Reprezentace ternárních vztahů Generalizace tabulka pro nadtyp + pro podtypy s primárním klíčem nadtypu pouze tabulky pro podtypy i s atributy nadtypu - všechno v jedné tabulce (rozlišení podle prázdné hodnoty)

Př. Spořitelna