EUNIS MetaCentrum - gridy pod mrakem 1 MetaCentrum – gridy pod mrakem Jiří Sitera, Miroslav Ruda, Luděk Matyska
MetaCentrum ►Česká akademická infrastruktura pro náročné výpočty ►Od roku 1996, původně MU, UK, ZČU ►Dnes součást e-Infrastruktury CESNET ►Národní gridová infrastruktura (NGI) Propojení kapacit různých projektů/univerzit/organizací napříč ČR Propojení ČR do mezinárodních aktivit (EGI – European Grid Infrastructure) Cíl: zvýšení konkurenceschopnosti VaV týmů EUNIS MetaCentrum - gridy pod mrakem 2
MetaCentrum – dostupné zdroje ►8500 CPU jader, HD uzly (2x4-8 jader) i SMP stroje (32-80 jader) ►550 TB datové prostory (plus řádově PB datová úložiště CESNET) ►Infiniband ►GPGPU Tesla ►Až 1,5 TB v uzlu ►Rychlý scratch disk EUNIS MetaCentrum - gridy pod mrakem 3
Grid – co to vlastně je? EUNIS MetaCentrum - gridy pod mrakem 4
Grid - první pohled ►Dávkové zpracování úloh Zadání úlohy (odkaz na data, řídící skript, případný paralelismus) Čekání ve frontě, hledání odpovídajících zdrojů (plánovač) Přidělení zdrojů, spuštění v definovaném prostředí (OS, knihovny, aplikace, autentizace, přístup k datům, atd.) Ukončení výpočtu, uvolnění zdrojů, oznámení uživateli EUNIS MetaCentrum - gridy pod mrakem 5 Plánovač Job Soubor zdrojů Fronta
Grid jako koncepce MetaCentra ►Propojování zdrojů (analogie power grid) Výpočetní uzly, diskové systémy, experimentální přístroje Zdroje různých vlastníků, pořízené za různých podmínek Přelévání/slévání kapacit dle daných pravidel, organizace výpočetních prostředí do vyššího celku ►HPC (high performance computing) prostředí Orientace na výkon, náročné a nadstandardní úlohy Software (180 instalovaných SW balíků) EUNIS MetaCentrum - gridy pod mrakem 6
Grid a jeho flexibilita ►MetaCentrum propojuje Propojený systém zdrojů různých vlastníků Zdroje dostupné různými způsoby, vlastně různé gridy ►Virtuální organizace (VO) Nástroj pro zvládnutí různorodosti, princip „rozděl a panuj“ Delegace pravomocí, uvnitř VO mají správci vysokou autonomii Podpora různých potřeb komunit a týmů, např. možnost instalovat vlastní aplikační SW, dedikovat HW, atd. ►Integrovaná infastruktura Společná národní AAI (uživatelé, jejich identity) Úzká integrace s datovými úložišti EUNIS MetaCentrum - gridy pod mrakem 7
A kde je ten cloud? EUNIS MetaCentrum - gridy pod mrakem 8
Cloudové rozhraní MetaCentra ►Technická podstata – uživatelská virtualizace Namísto jobů (programů) uživatel zadá celý virtuální stroj (včetně operačního systému) Koncepčně stejný přístup jako k jobům EUNIS MetaCentrum - gridy pod mrakem 9 Plánovač Job VM Job VM Soubor zdrojů Fronta
HPC cloud ►Zobecnění a větší flexibilita proti gridu Výpočet lze zadat včetně kompletního prostředí pro běh Uživatel dostane práva superuživatele (systémový SW, knihovny, OS, vše v jeho kompetenci) Snížení vstupního prahu pro týmy (existující vlastní prostředí, vlastní správce, speciální požadavky) ►HPC cloud Stejný přístup jako u výpočetních úloh – plánování, přidělení, výpočet, ukončení Pro náročné výpočty, nikoli pro provoz permanentních služeb EUNIS MetaCentrum - gridy pod mrakem 10
Virtuální cluster ►Uživatel požádá o celý cluster Obdoba paralelního výpočtu Vlastní plně dedikovaný cluster ve své správě ►Síť jako nový zdroj (resource) Virtuální síť (L2 segment, VLAN) jako nový zdroj dostupný uživatelům (přiděluje plánovač podobně jako třeba CPU) Díky schopnostem sítě CESNET může být rozprostřena přes ČR Důsledky: stroje mohou být uživatelské včetně uživatelské IP adresy, privátní VLAN, celá síť uzlů různých rolí, atd. EUNIS MetaCentrum - gridy pod mrakem 11 VM Dedikovaná VLAN
Use case: nové možnosti ►Potřebuji pro aplikaci jiný OS (typicky MS Windows) Vlastní vývoj, komerční aplikace, složitá nebo nemožná portace Žádné podmínky ze strany MetaCentra (autentizace, autorizace, dávkový systém, bezpečné protokoly a SW, atd.) ►Vlastní nástroj pro řízení zpracování (workload manager) Vlastní vývoj, BOINC, jednoduché skripty na míru Příklady: průběžné testování vyvíjeného SW, genetické programování ►Buduji celé prostředí Příklady: testovací polygon pro bezpečnostní výzkum sítě, simulace distribuovaného systému (SmartGrids – sběr dat a řízení v energetice) EUNIS MetaCentrum - gridy pod mrakem 12
Use case: rozšíření lokálního clusteru ►Postavíme virtuální cluster, který Má VLAN napojenu na místní síť uživatele (L2 segment, kde je fyzický cluster) Jeho uzly jsou kopie uzlů fyzického clusteru (obrazy) ►Uživatel vidí známé prostředí rozšířené o nové uzly S MetaCentrem interaguje jen správce lokálního clusteru Prostředí je stejné do všech detailů, nové uzly jsou nerozlišitelné od fyzických (dávkový systém, autentizace, SW, konfigurace) EUNIS MetaCentrum - gridy pod mrakem Fyzická část Virtuální část Domácí síť uživatele
Use case: nafukovací služby ►Příklad: nafukovací databáze Poskytuje interface: ulož data, vyhledej Distribuovaná na několik uzlů (data, indexy, paralelizace dotazů) Umí automaticky měnit velikost (počet uzlů) Interní servisní proces řídí replikaci dat, tvorbu indexů, optimalizaci dotazů Přidáváním/ubíráním uzlů se mění „jen“ kapacita, výkon ►Možný scénář: databáze běžící „v malém“ u uživatele se v případě potřeby experimentu „nafoukne“ do MetaCentra ►Příklady: ElasticSearch, MongoDB – viz následující přednáška EUNIS MetaCentrum - gridy pod mrakem 14
Naše mezinárodní spolupráce v cloudech ►Federated clouds V rámci EGI (Evropské gridové infrastruktury) Mezinárodní kooperující skupina cloudů Propojení autentizace, bezpečnosti, accountingu, monitoringu, informačních služeb Společná knihovna připravených obrazů virtuálních strojů Standardy pro cloudové rozhraní OCCI Open Cloud Computing Interface CDMI Cloud Data Management Interface Účast MetaCentra na vývoji a evropském testbedu EUNIS MetaCentrum - gridy pod mrakem 15
Reklamní vložka EUNIS MetaCentrum - gridy pod mrakem 16
MetaCentrum je tu pro vás ►Pro výzkumné a výukové účely akademických institucí ČR, od jednotlivých studentů až po velké týmy ►„Platí“ se kvalitou a úspěšností vlastní práce Koncept: cílem infrastruktury je, aby její uživatelé měli kvalitní výsledky Publikace s poděkováním, případně jiné reference na VaV výsledky vzniklé díky MetaCentru Lepší výsledky = lepší priorita při přidělování zdrojů (motivační systém, průběžný systém zadávání výsledků a nastavování priorit) Počítat můžete začít ihned, na výsledky se ptáme až za rok EUNIS MetaCentrum - gridy pod mrakem 17
MetaCentrum je partner ►Naším cílem je e-Infrastrukturou řešit potřeby VaV týmů Překonání dosavadních limitů – aplikací špičkové ICT infrastruktury Nové možnosti – tam, kde dosud nebylo ICT třeba, nové přístroje, nové objemy dat, nové zpracování existujících dat „Ambicí je nejen poskytovat služby, ale i posunout schopnost vědeckých týmů využívat nové technologie a možnosti infrastruktury.“ ►Konkrétní možnosti Semináře, cílené akce pro konkrétní skupiny Návrh a optimalizace algoritmů, modelů, nástrojů a prostředí Společné projekty – spolupráce informatiků a různých vědeckých oborů EUNIS MetaCentrum - gridy pod mrakem 18
Národní akademická licence Matlab ►Možnost získat skutečně národní plovoucí licenci Záměr je v souladu s EUNIS, Klubem ředitelů, CESNETem Máme podle našeho názoru přijatelnou nabídku Mathworks Jsou k dispozici finanční zdroje (VaVpI projekt eIGeR CESNET) Podle zkušeností z minulosti se jedná o výjimečnou příležitost ►Záměr rozvoje MetaCentra Poskytovat nákladný SW jako nový zdroj/službu dostupnou samostatně Matlab je dobrý kandidát, nejužívanější placený SW v MetaCentru (350 licencí, 150 simulink, 700 toolboxy) Provoz nové služby nejméně do roku 2020, k úspoře dojde na úrovni institucí/projektů, nebudou potřebovat vlastní licence EUNIS MetaCentrum - gridy pod mrakem 19
Matlab – co je třeba k úspěchu ►Podpora institucí/týmů/projektů Deklarace zájmu, indikace dostatečného objemu uživatelů Do reakce institucí (deklarace zájmu, kontaktní osoba) na dopis ředitele CESNETu rektorům ►Sestavení vhodné struktury licence Podklady do Licence je strukturována (počet plovoucích licencí mezi toolboxy) Omezení ze strany Mathworks – min. 500 licencí na toolbox Během provozu nelze národní licenci jednoduše měnit (minimální nákup opět 500 licencí); současné licence ale zůstanou platné a půjde dokupovat individuálně EUNIS MetaCentrum - gridy pod mrakem 20
Shrnutí ►Cloudové rozhraní MetaCentra Flexibilita, kontrola prostředí uživatelem, speciální potřeby HPC Cloud – místo výpočtu celý obraz stroje, jinak jako grid ►Virtuální výpočetní cluster Komplexní abstrakce nad zdroji „v cloudu“ Nový zdroj dostupný uživatelům - síť ►Cíl: zlepšení pro uživatele Nové možnosti Odbourání některých bariér plného využití MetaCentra EUNIS MetaCentrum - gridy pod mrakem 21 Děkuji za pozornost