Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilBožena Müllerová
1
Architektury a technika databázových systémů Jiří Zechmeister jiri.zechmeister@unicornsystems.eu 1., 2. přednáška 5.10.2016
2
Organizace předmětu Zápočet Detailní informace v rámci cvičení Zkouška Ústní Připomínky, dotazy, náměty Formou e-mailové komunikace Osobně na přednáškách, resp. Cvičeních Pokyny, informace, zajímavosti, etc. https://orajz.wordpress.com/
3
Obsah předmětu
4
Cíl předmětu Rozšířit znalosti tvorby databázových systémů Vývojářský versus databázový pohled na IS Seznámit posluchače s praktickými zkušenostmi Zvládnout pokročilé metody práce s SQL databázemi
5
Co nás čeká Seznámení s databází Oracle (dnes) Architektura databáze Oracle (taky dnes ) Integrita dat Databázové indexy Zpracování SQL Tvorba efektivních dotazů Execution plan Wait interface a sql trace Transakční zpracování Zabezpečení a ochrana dat Porovnání Oracle s MS SQL Serverem Praktické zkušenosti „Jak to nedělat“ ;)
6
Úvod do architektury DB
7
Datová vrstva jako základ IS Základním úkolem IS je zpracování dat vytváření nových čtení a modifikace existujících Kde ukládat data In-memory – typicky operační paměť s objekty Flat file – File system, výměna mezi systémy Structured file – typicky XML Databáze
8
Datová vrstva jako základ IS II Třívrstvá architektura Úzká interakce s business logikou Problém soudržnosti logiky
9
Požadavky na databázi Způsob zpracování a množství dat závisí na typu IS OLTP (On-line Transaction Processing) Interaktivní zpracování dat, vyznačující se velkým množstvím přístupů (včetně paralelních), které ale pracují jen s relativně malým množstvím souvisejících dat (typicky může jít o zpracování údajů uživatelem ve formuláři), z typů operací převažuje čtení OLAP (On-line Analytical Processing) Zpracování může sice probíhat jen na části databáze, ale protože se jedná o interaktivní proces, nelze předpovídat, ke kterým datům bude přistupováno, navíc jich je velké množství, protože z nich typicky vznikají statistiky K datům je přistupováno v módu pouze pro čtení
10
DBMS DB realizovány pomocí Specifického softwarového systému tzv. DBMS (Database Management System) česky - možná nepěkně – SŘBD, Systém řízení bází dat Obecný DBMS se skládá definice modelu dat – relační, hierarchický, objektový, …, určuje typ databáze definice formátů dat na disku - tzv. metadat, katalogu typů záznamů struktur pro uložení vlastních dat - fyzická implementace, zápis/čtení do souborů dotazovacího a manipulačního jazyka nad daty - poskytujícího abstrakci od fyzického uložení mechanizmu pro podporu transakcí pro zajištění konzistence bezpečnostní politiky uživatelské účty oprávnění pro přístupy k datům nástrojů pro podporu správy databází
11
Typy databází – model dat
12
Hierarchický a síťový model Data strukturována hierarchicky Vztah reprezentován jako rodič a potomek Potomek vždy přiřazen jednomu rodiči Nejjednodušší si představit na příkladu fungování souborového systému v 70.-80. letech popsán také síťový model odstranil omezení na pouze jediného předka pro každý záznam v praxi se příliš nerozšířil Výhody rychlost zapracovaná referenční integrita Nevýhody problém se vztahy N:M
13
Relační model Relační model dat vychází z matematického pojmu relace Sada dvourozměrných tabulek Datové záznamy ukládané do řádků tabulky Každý sloupec představuje jeden atribut záznamu V jedné tabulce jsou uloženy všechny záznamy jednoho typu Typ záznamu je dán seznamem pojmenovaných atributů (sloupců tabulky) datovými typy jednotlivých atributů tzv. integritními omezeními (integrity constraints) Obrovská výhoda v existenci dotazovacího a manipulačního jazyka SQL Představuje společný standard, dodržovaný nejen výrobci relačních databází, ale dokonce i u jiných typů DBMS
14
Objektový model Místo tabulek jsou uloženy přímo objekty se svými vlastnostmi Není nutné přemýšlet nad strukturami tabulek Nabízí využití možností vícenásobné dědičnosti, zapouzdření a polymorfizmu Implementace Mongo DB db4o Multi-dimenzionální model
15
Databáze Oracle
16
Oracle Unikátnost Oracle Způsob zamykání dat Zámky pouze pro měněná data Zámky na úrovni řádků – neexistuje/není potřeba eskalace Všechno je podřízeno bezpečnosti dat – při dodržení všech best practices prakticky nemůže dojít ke ztrátě dat Důraz na výkon v enterprise řešeních Počítá se s nasazením na odpovídajícím HW, na udržovaném OS s kompetentním adminem ;) Není to „malá“ databáze a nikdy nebude Express edititon lze použít i na malé projekty, ale … Do budoucna se bude hlavně prodávat už dohromady s HW Oracle Exadata Oracle technologies http://www.orafaq.com/wiki/Oracle_Product_Sethttp://www.orafaq.com/wiki/Oracle_Product_Set
17
Oracle verzování major.maintenance.application-server.component-specific.(platform- specific.) Např. 10.2.0.4.0 SELECT * FROM PRODUCT_COMPONENT_VERSION; Přehled verzí Oracle9i Database Release 1: 9.0.1.0–9.0.1.5 (patchset prosinec 2003) Oracle9i Database Release 2: 9.2.0.1–9.2.0.8 (patchset duben 2007) Oracle Database 10g Release 1: 10.1.0.2–10.1.0.5 (patchset únor 2006) Oracle Database 10g Release 2: 10.2.0.1–10.2.0.5 (patchset duben 2010) Oracle Database 11g Release 1: 11.1.0.6–11.1.0.7 (patchset září 2008) Oracle Database 11g Release 2: 11.2.0.1–11.2.0.3 (patchset září 2011)
18
Oracle Edice Enterprise Edition (EE) Licenční politika podle počtu CPU, typicky 4 a více Bez paměťových limitů, Oracle RAC software Standard Edition (SE) Základní sada vlastností, bez paměťových limitů Standard Edition One (SEO) Systémy s 1-2 CPU Express Edition (XE), Volná distribuce Windows a Linux 1 CPU, 4GB paměť, 4GB uživatelská data Oracle Database Lite Mobilní zařízení, synchronizace se serverem Více http://www.orafaq.com/wiki/Oracle_Licensinghttp://www.orafaq.com/wiki/Oracle_Licensing
19
Obsah Fyzická architektura Objekty schématu Logická architektura Paměťová architektura – Datový slovník Procesní architektura
20
FYZICKÁ ARCHITEKTURA
21
Co je to databáze Kolekce dat na disku uložená v jednom nebo více datových souborech – Jsou zde uložena veškerá data databáze Fyzicky se skládá z – DataFiles – ControlFiles – Redo Log Files – Archive Log Files – Alert and Trace Files – Backup Files
22
Co je to instance databáze Skládá se z – bloku přidělené paměti, který je vyhrazený v System Global Area (SGA) – z procesů, které běží na pozadí a komunikují s SGA a databázovými soubory na disku
23
Data File Veškerá data databáze uložena v Data Files – Uložena data logických databázových struktur
24
Control File Obsahuje metadata – data o fyzické struktuře databáze Například – Název databáze – Jména a místo uložení datafiles a redo logů – Čas vytvoření databáze – … Při změnách struktury je ihned aktualizován
25
Redo Log File Při každém přidání, odstranění nebo změně dat v tabulce, indexu nebo jiném objektu databáze Oracle je zapsán záznam do aktuálního souboru protokolu Každá databáze Oracle musí mít alespoň dva soubory protokolu – Když je jeden Redo Log zaplněn záznamy, je tento soubor označen jako ACTlVE v případě, kdy je potřebný pro případnou obnovu instance INACTlVE, pokud není potřebný pro obnovu instance – Záznamy se pak začnou zapisovat do dalšího souboru protokolu ze seznamu od začátku souboru a tento soubor je označen jako CURRENT.
26
Alert and Trace Log Kompletní audit nad veškerými operacemi – Pokud dojde ke vzniku chyby při běhu databáze, Oracle obvykle zapisuje chybové zprávy do alert logu nebo v případě procesů běžících na pozadí do trace logu – Jsou zde zaznamenány i všechny příkazy alter database i alter system, které provedl správce databáze.
27
Archive Log Při ARCHIVELOG režimu lze všechny zápisy do Redo Logs automaticky archivovat
28
LOGICKÁ ARCHITEKTURA
29
Logická struktura Definuje logické úložné struktury – Datové bloky (Data blocks) – Rozsahy (Extents) – Segmenty (Segments) Toto logické rozdělení úložného prostoru umožňuje účinnější kontrolu nad využitím diskového místa
30
Logické úložné struktury Tabulkový prostor – tablespace Vztah – Datový blok (Data block) – Rozsah (Extent) – Segment
31
Datový blok Nejmenší úložnou jednotkou databáze Oracle Velikost bloku – číslo udávající počet bajtů, které blok zabírá v daném tabulkovém prostoru – Často definována jako násobek velikosti bloku, definované operačním systémem
32
Struktura datového bloku Hlavička (Header) – Základní informace Adresa bloku, typ segmentu Tabulkový rejstřík (Table directory) – Informace tabulce řádků Řádkový rejstřík (Row directory) – Informace o počtu řádků – Adresy řádků Všechny tyto informace tvoří tzv. Overhead
33
Řízení volného místa PCTFREE – Určuje minimální velikost (%) datového bloku, který musí být rezervován na data
34
Řízení volného místa PCTUSED – Určuje minimální velikost (%) datového bloku, který muže být použit pro row data a overhead
35
Extents (Rozsahy) Vyšší úrovní logického seskupování elementů v rámci databáze Sestává z jednoho nebo několika datových bloků V případě, kdy místo v segmentu dojde, Oracle alokuje nový extent
36
Segment Skládá se z množiny rozsahů V databázi Oracle rozlišujeme čtyři typy segmentů: – Datové segmenty (Data segments) – Indexové segmenty (Index segments) – Dočasné segmenty (Temporary segments) – Návratové segmenty (Undo segments)
37
Data segment Data segment v Oracle udržuje všechna data pro: – Databázovou tabulku – Partition v partitiované tabulce – Cluster v clusterované tabulce Oracle vytvoří data segment, vždy s novou tabulkou – CREATE TABLE, apod.
38
Rollback segment Rollback segmenty – V Oracle 11g existuje návratový segment pouze v tabulkovém prostoru SYSTEM Čistě systémový segment – V předchozích verzích byl návratový segment využíván pro ukládání undo informací
39
Ostatní segmenty Index segment – Každý index je uložen ve svém vlastním indexovém segmentu Temporary segment – V případě, kdy provedení příkazu jazyka SQL vyžaduje pro své dokončení diskový prostor je alokován dočasný segment – Existují pouze po dobu trvání příkazu jazyka SQL
40
Vztah logické a fyzické architektury
41
OBJEKTY SCHÉMATU
42
Základní přehled Tabulky Pohledy Materializované pohledy Sequence Generatory Synonyma Indexy Index-Organized Tabulky Clustery
43
PAMĚŤOVÁ ARCHITEKTURA
44
Paměťové struktury V paměti je spustitelný kód, informace o relacích, jednotlivé procesy databáze a informace sdílené mezi procesy Obsahují uživatelské příkazy jazyka SQL a také vyrovnávací paměť, jejíž obsah je dle potřeby ukládán na disk a která obsahuje datové bloky databázových segmentů a informace o dokončených databázových transakcích. Datová oblast vyhrazená pro instanci Oracle se nazývá globální systémová oblast SGA (System Global Area) Pro každý server a proces běžící na pozadí v paměti existuje oblast s názvem globální programová oblast PGA (Program Global Area).
45
Paměťové struktury
46
Globální systémová oblast SGA Skupina paměťových struktur instance Oracle sdílená uživateli databázové instance Při spuštění instance Oracle je pro oblast SGA vyhrazena paměť v závislosti na hodnotách nastavených v inicializačním souboru parametrů Parametr SGA_MAX_SIZE – celková velikost všech oblastí SGA nesmí překročit hodnotu SGA_MAX_SIZE
47
Buffer cache Součást SGA Udržuje data načtená z datafiles Všechny uživatelské procesy jsou připojeny – Nevýhoda konkurenčního přístupu
48
Shared pool Součást SGA Rozděleno na – Vyrovnávací paměť knihoven (Library cache) Vyrovnávací paměť pro SQL (PL/SQL) Prováděcí plány Pozor na poddimenzovanou velikost – Vyrovnávací paměť datového slovníku (Dictionary cache) Informace o tabulkách (struktury tabulek) ve schématu SYS, SYSTEM – Obsahuje metadata databáze Velké čtení v době parsování SQL
49
Globální programová oblast PGA Oddíl paměti alokovaný pro privátní použití jedním procesem Konfigurace závisí na konfiguraci připojení databáze Oracle – sdílený server (shared server) uživatelé sdílejí připojení k databázi, čímž se minimalizuje využití paměti na serveru informace o uživatelských relacích uloženy v oblasti SGA místo v oblasti PGA ideální pro velký počet současných připojení k databázi s malým množstvím krátce trvajících požadavků – vyhrazený server (dedicated server) V prostředí s vyhrazeným serverem má každý uživatelský proces vlastní připojení k databázi a paměť vyhrazená pro relace je v oblasti PGA Obsahuje také oblast pro řazení – se použije vždy, když uživatelský požadavek vyžaduje provést řazení, popř. Hash join
50
PROCESNÍ ARCHITEKTURA
51
Procesy Oracle
52
Serverové procesy (Server processes) – Obsluha uživatelských požadavků Background procesy – PMON – SMON – DBWn – LGWR – RECO – ARCn
53
Procesy Oracle Oracle hell ;)
54
Proces SMON System monitor – V případě pádu systému nebo selhání instance, proces SMON provede obnovu instance aplikováním záznamů z online souboru protokolu na datové soubory – Zabezpečuje čištění dočasných segmentů ve všech tabulkových prostorech (tablespaces) – Jednou z úloh procesu SMON je i pravidelné slučování volného místa v tabulkových prostorech u tabulkových prostorů řízených slovníkem
55
Proces PMON Process monitor – Pokud je uživatelské připojení přerušeno nebo uživatelský proces selže z jiného důvodu, provede proces PMON, potřebné úklidové práce – Vyčistí vyrovnávací paměť a ostatní prostředky, které uživatelské připojení používalo – Uživatelská relace například mohla provádět aktualizaci některých řádků v tabulce a tím tyto řádky uzamknout Ukázka práce PMON při odpojení relace – Vrátí zpět změny provedené transakcemi, které probíhaly před výpadkem – Označí ve vyrovnávací paměti bloky, použité transakcemi jako volné – Odstraní uzamčení na odpovídajících řádcích tabulky – Odstraní identifikátor odpojeného procesu ze seznamu aktivních procesů
56
Proces DBWn Databázový zapisovač – Zapisuje nové nebo změněné datové bloky (dirty blocks) z vyrovnávací paměti do datových souborů Až 20 procesů DBW0 – DBW20 – Určován parametrem DB_ WRITER_PROCESSES
57
Proces LGWR Zapisovač protokolu – řídí správu vyrovnávací paměti protokolu – nejaktivnější proces v instanci s velkou aktivitou příkazů pro manipulaci s daty – transakce není považována za dokončenou, dokud proces LGWR nezapíše úspěšně všechny záznamy, včetně záznamu o operaci commit, do souborů protokolu
58
Proces RECO Proces obnovy – ošetřuje selhání distribuovaných transakcí
59
Proces ARCn Proces archivátor – provádí kopírování souborů protokolu na ostatní nadefinovaná umístění vždy, když se soubor protokolu zaplní
60
Q&A
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.