Datová úložiště Zdroj: IBM
Malé ohlédnutí Děrné štítky, děrná páska a magnetická páska
Malé ohlédnutí 5 ¼ disketa, 3 ½ disketa, ZIP drive, Syquest
Malé ohlédnutí (?) DVD, DVD RAM v kazetě, HD DVD neuspělo proti Blue-ray diskům
Ukládání dat „domácí“ Uložení na pevný disk počítače Použití pro malé objemy Typicky domácí a kancelářské použití Když záloha, tak na CD nebo DVD
Ukládání dat „profi“ Ukládání dat na několik disků najednou Jištění dat na více místech Zrychlení záznamů Duplikace záznamů Zdroj: OK System
Ukládání dat – historie Network Attached Storage (dále jen NAS) 1983 Novell NetWare a NCP LAN Manager iSCSI (síťový protokol pro připojení úložného prostoru) SAN (Storage Area Network) – vysokorychlostní síť, komunikující obvykle se serverem prostřednictvím optického kabelu.
SAN Storage Area Network Dedikovaná datová síť (fyzické oddělení dat a serverů) Oddělená od LAN, WAN,… Slouží k připojení externích zařízení k serverům Sdílení zdrojů (diskové pole, zálohovací zařízení) Více cest ke zdrojům Ukládá „blokově“ File systém zůstává na straně „klienta“
SAN Storage Area Network Vyšší náklady Lepší propustnost Větší počet zařízení – výhoda při zálohování Vynikající bezpečnost Disaster Recovery Využití stávajících komunikačních technologií (ESCON-opt, Fibre Channel, iSCSI, ATA over Ethernet, Hyper SCSI)
Storage Area Network SAN
Network Attached Storage NAS Levnější Lépe se s ním pracuje Instalaci i provoz zvládne i nezkušený uživatel Ovládá úložiště i file systém Nefunguje jako server Jde o jediný disk, umožňující centrální sdílení dat NAS se oproti tomu odlišuje tím, že jde v základu o jediný disk, umožňující centrální sdílení dat (podtrhuji „dat“, nikoliv tedy třeba databází).
Network Attached Storage NAS
NAS NAS Server Síťové datové uložiště Možno osadit různým počtem disků Využití k mnoha účelům Sdílení souborů (i napříč platformami – např. Windows, Mac OS, Linux atd.) Přístup k souborům přes webový prohlížeč.
NAS Q-Nap Turbo NAS server All-in One síťové datové úložiště Až 4 disky SATA II Hot-Swap (výměna bez vypnutí) Možnost RAID Malá spotřeba
SAN vs. NAS NAS je úložné zařízení, které pracuje s datovými soubory. SAN je lokální síť více zařízení, která pracují s bloky disků. SAN obvykle využívá Fibre Channel (nebo podobné technologie) pro propojení. NAS obvykle využívá Ethernet a TCP/IP připojení.
NAS NAS vs. DAS Direct Access Storage Přímo připojené úložiště DAS – je rozšíření serveru, nemusí být v síti NAS – sdílení souborů v síti
NAS vs. SAN NAS – ukládání i souborový systém NAS – i pro domácnost SAN – blokové ukládání, file systém zůstává na klientské straně
Ukládání dat Požadavky: Dosažení větší rychlosti Ochrana dat vůči výpadku jednoho z disků Kombinace obojího
RAID Ukládání dat Redundant Arrays of Independent Disks Redundantní* pole nezávislých disků * V informatice jde o informační nebo funkční nadbytek. Redundance je důležitá jako prostředek ke zvyšování spolehlivosti a odolnosti proti chybám.
RAID 0 (stripping) Princip proužkování dat (stripping). Dva i víc disků Na ně ukládá data rozdělené na „proužky“ o velikosti několika kB. Liché proužky – 1. disk Sudé proužky – 2. disk. Zápis a čtení zhruba dvojnásobek propustnosti jednotlivých disků
RAID 0
RAID 1 (mirroring) Zvýšení bezpečí dat. 2 a víc disků Každý z nich má stejný obsah Pokud jeden disk selže, ostatní nahradí data Pokud se zničí všechny disky (např. vadný zdroj), RAID nezabrání ztrátě dat
RAID 1
RAID 1
RAID 2 = (RAID 0 + ECC) RAID 2 Do základního RAID 0 se přidává pole dodatečnou ochranu dat pomocí ECC korekce (Error Checking and Correction). Vyžaduje však podporu ze strany pevných disků Komerčně se nijak nepoužívá RAID 2 se dnes nepoužívá, protože prakticky nejsou disky,ketré by přímo ECC podporovaly. Levněji vychází zařazení dalšího disku do systému.
RAID 3 Vychází ze „stripped“ pole RAID 0 Ochrana dat – ukládání paritní informace na vyhrazený disk Na ostatní disky jsou data ukládána v malých „proužcích“ (na úrovni bajtů) Z každého disku v poli je vždy pro každý bit na stejné pozici (v bajtu) vypočítána parita
RAID 3 Při výpadku jednoho disku je pak možné z dat uložených na zbývajících discích a paritních informací dopočítat ztracená data RAID 3 opět vychází ze “stripped” pole, používá však praktičtější metodu ochrany dat – ukládá paritní informace na vyhrazený disk. Na ostatní disky jsou data ukládána v malých “proužcích” (na úrovni bajtů). Z každého disku v poli je vždy pro každý bit na stejné pozici (v bajtu) vypočítána parita (funkcí XOR – exclusive OR) a uložena na “paritní disk”. Při výpadku jednoho disku je pak možné z dat uložených na zbývajících discích a paritních informací dopočítat ztracená data (po výměně vadného disku za nový). Proces dopočítání ztracených dat si samozřejmě vyžádá nějaký čas a hlavně výpočetní výkon, takže po dobu rekonstrukce dat je výkon celého systému poněkud snížen a stejně tak jeho schopnost vytvářet paritní informace. výkon RAID 3 trpí při zápisu nutností přečíst paritní data z vyhrazeného disku a znovu je na něj uložit. Zápis je tak o něco pomalejší a paritní disk je limitujícím členem RAID 3. Při čtení je výkon RAID 3 vyšší než při použití jediného disku, protože data jsou čtena paralelně z několika disků najednou, podobně jako u RAID 0 pole. Pouze v případě aplikací vyžadujících krátké úseky dat (typicky databáze) není výkon RAID 3 o mnoho vyšší ve srovnání s jediným diskem.
RAID 3
RAID 4 Obdoba RAID 3 Používá dostatečnou velikost “proužku” pro uložení celého záznamu (pracuje na úrovni bloků) Výhodné pro databázové systémy RAID 4 se velmi podobá předchozímu RAID 3. Také používá dva nebo více disků pro uložení informací a jeden vyhrazený disk pro uložení paritních informací. Používá však dostatečnou velikost “proužku” pro uložení celého záznamu (pracuje na úrovni bloků). To umožňuje přistupovat k uloženým informacím nezávisle, což je výhodné pro čtení velkého množství malých bloků dat (např. pro databázové systémy). Stále ale trpí stejným problémem při zápisu jako RAID 3
RAID 4
RAID 5 (stripping with stripped parity) Ukládá data po blocích na různé disky Dopočítává k nim tzv. paritu Paritu střídavě ukládá na různé disky. Bezpečnost dat vůči poruše disku Urychlení práce s daty (paralelizací operací čtení/zápisu) Čím víc disků, tím lepší efektivita RAID 5 ukládá data po blocích na různé disky a zároveň k nim dopočítává tzv. paritu, kterou střídavě ukládá na různé disky. Tak je dosaženo jak bezpečnosti dat vůči poruše disku (chybějící data se dají z parity vypočítat) i urychlení práce s daty (paralelizací operací čtení/zápisu). RAID 5 se používá všude tam, kde je potřeba docílit ochrany dat a vysokého výkonu. Výhodou je, že čím je v poli větší počet disků, tím roste efektivita ukládání dat.
RAID 5
RAID 6 Obdoba RAID 5 Vytváří dvě nezávisle vypočtené paritní informace Nejspolehlivější I při výpadku dvou disků lze data znovu zrekonstruovat Pomalejší Dražší
RAID 6 RAID 6 je posledním (nehybridním) diskovým polem. Podobně jako RAID 5 využívá rozprostření paritních informací na všech discích v poli, vytváří však dvě nezávisle vypočtené paritní informace. RAID 6 je díky tomu nejspolehlivější a i při výpadku dvou disků lze data znovu zrekonstruovat. Rychlost čtení je srovnatelná s RAID 5, avšak zápis je o něco pomalejší, protože je nutné vypočítat a uložit dvě sady paritních informací. Také cena RAID pole je o něco vyšší, používá se proto jen tam, kde je kladen opravdu maximální důraz na spolehlivost a přístupnost dat
RAID 7 RAID 7 bylo vytvořeno firmou Storage Computer Corporation. Odvozeno od RAID 3 a RAID 4 K nim přidává vyrovnávací paměť.
RAID 0 + 1 Diskové pole typu RAID 0, které je zrcadleno Kapacita dána nejmenším diskem ve svazku
RAID 0 + 1
RAID 1 + 0 Data se v diskových polích zrcadlí Pak se ukládají do pole typu RAID 0 Max. počet disků v každém poli, který může selhat je 1 Použití: vytížené databáze
RAID 1 + 0
RAID 50 Raid 5 + 0
RAID 60 RAID 6 + 0
RAID 100 RAID 10 + 0
JBOD Just a Bunch of Disks „Jen hromada disků“ Opak partitioningu Máme 250 GB a 500 GB RAID 0 = 500 GB (dvojnásobek menšího z obou) RAID 1 = 250 GB (menší z obou) JBOD = 750 GB (součet obou)
Animace http://www.acnc.com/raidedu/0
Datové úložiště IBM Technology Review (2010) Společnost IBM v Kalifornii začala stavět největší datové úložiště na světě (dnes už je hotovo). Velikost až 120 PB, (120 tisíc TB). Pro zákazníka, který si nepřeje být jmenován. 200 000 tradičních magnetických rotačních pevných disků (HDD).
Datové úložiště IBM Vysokootáčkové disky se nachází ve vodě a tak se zajišťuje chlazení. Uchováván je až jeden bilión souborů v ostrém provozu.
Datové úložiště Zdroj: APC
Datové úložiště Zdroj: IBM a O2
Datové úložiště Zdroj: APC
Mobilní datové centrum http://www.altron.cz/mobilni-datove-centrum/
Datové úložiště Google Kontejnerové úložiště Google