Představení PBS Professional Dalibor Klusáček

Slides:



Advertisements
Podobné prezentace
E-learning – moderní elektronická podpora výuky
Advertisements

Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
Překlad Bath profilu 2.0 Martin Vojnar
IKT PHP PHP Tvorba formuláře - 10 Mgr. Josef Nožička
Program péče o zákazníky a produkty ALCOMA Instalace, helpdesk, dohledové a servisní služby.
Windows 8 ZMVS. Windows 8 Nové 3D uživatelské rozhraní s kódovým názvem Wind. Nové uživatelské rozhraní bude požadovat minimálně 170MB video paměti a.
CSS a HTML 5. HTML 5 HTML5 je nová verze specifikace značkovacího jazyka HTML, která přináší podstatné změny v technologiích webových stránek. HTML5 umožňuje.
Vytváření, použití dávkových souborů
SOFTWARE dálkové studium PODNIKÁNÍ 2. listopad 2006.
Softwarový systém DYNAST
Operační systémy. OPERAČNÍ SYSTÉMY pomoc operátorovi, podpora vlastností reálného času, víceuživatelských a více úlohových systémů.
UŽITEČNÉ PROGRAMY – MŮJ PRVNÍ SKRIPT Spustíme více prográmků najednou. SPŠ Teplice - 3.V.
Přínosy virtualizace a privátního cloudu
Přínosy a druhy počítačových sítí. Jednou z nejvýznamnějších technologií používaných v oblasti výpočetních systémů jsou již řadu let počítačové sítě.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
FORMALIZACE PROJEKTU DO SÍŤOVÉHO GRAFU
Praha6.cz Nové trendy v e-publishingu Statické stránky, mapa stránek, menu a fulltextové vyhledávání.
Museli jsme začít úplně od nuly Nalezeno 13 PC navíc, některé bez licence Opis smlouvy School Agreement (20 PC) Pravidelné plně automatizované kontroly.
17.Tabulkový procesor (filtrování a řazení dat, formuláře, podmínky a podmíněné formátování, export a import dat) Barbora Skoumalová 4.A.
MetaCentrum1 MetaCentrum a projekty FR CESNET Náročné výpočty a zpracování dat Jiří Sitera.
Proces řízení projektu
X13PMT 2. seminář Ing. Martin Molhanec, CSc. Garant předmětu ČVUT – FEL, K13113.
Tabulkový procesor.
Školení správců II. Petr Pinkas RNDr. Vít Ochozka.
Maturitní okruh č. 7. Odstínit aplikace od specifik HWSpráva procesůSpráva pamětiSpráva souborůSpráva vstupů a výstupůSpráva sítěSystém ochrany a bezpečnostiSystém.
Štěpán Lískovec, 4.A.  =základní programové vybavení počítače (tj.software)  hlavní úkol:  A, zajistit uživateli možnost ovládat PC  B, vytvořit pro.
Slide 1 A Free sample background from © 2003 By Default! Jiří Kůsa Testování propustnosti síťového firewallu.
INFSO-RI Enabling Grids for E-sciencE Charon Extension Layer (CEL) Jan Kmuníček CESNET.
Databázové systémy Architektury DBS.
4. Lekce Dílčí procesy funkčního testování
Reporting Ing. Jan Přichystal, Ph.D.. Úvod Uživatelé obvykle přistupují k DW pomocí BI aplikace Většina využívá předdefinované reporty Poskytují standardizovaný.
Možnosti modelování požadavků na informační systém
Představení nové verze OPSI Kamil Malinka Martin Lebeda PROJEKT financovaný z Operačního programu Vzdělávání pro konkurenceschopnost ZVYŠOVÁNÍ IT GRAMOTNOSTI.
Projekt realizace referenčního rozhraní Ing. Jan Pokorný Ministerstvo informatiky ČR ISSS, 5. dubna 2005.
Jazyk XML Jazyk pro tvorbu strukturovaných dokumentů Syntaxí velmi podobný HTML Hlavní cíle návrhu: Snadná editace - jazyk je textový Snadné strojové zpracování.
Databáze Dotazy VY_32_INOVACE_7B16. Dotazy umožňuje vybrat určité záznamy z tabulky na rozdíl od filtru vybrané záznamy umístí do samostatné dočasné nebo.
Dokumentace informačního systému
Martina Braunerová.  nejdůležitější program v počítači  umožňuje všem ostatním programům fungovat  prostředník mezi počítačem a uživatelem.
Vývoj výpočetního modelu
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
2 Fučíková Sylvie HR/Win – moderní technologie pro osvědčené aplikace.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Windows XP a live distribuce Knoppix, Danix apod
Anopress: nová grafika, nové možnosti Mgr. Daniela Uhrová září 2010.
OPERAČNÍ SYSTÉMY.
14. června 2004Michal Ševčenko Architektura softwarového systému DYNAST Michal Ševčenko VIC ČVUT.
Mikroprocesor.
Pavel Olšan & Ondřej Mrzena.  Co je server  Funkce  Verze Windows a instalace  Active Directory  Účty  DNS  DHCP  .
filtrování a řazení dat, podmíněné formátování,
GRASS GIS Alternativní GIS – volně dostupné programy a data.
1 Martin Vojnar Bibliografie jako nezbytná součást jednotného vyhledávaní SNK v Martine, 7. listopadu 2011.
Kontakty Webpage přednášky: – Slajdy (MS PowerPoint): –ftp://ulita.ms.mff.cuni.cz/predn/PRG017 Technické.
Centrální registr ●software a technické zabezpečení Ladislav Filip ●odborná konzultace Jaromír Kolařík ●zastřešuje jako celek Imatrade.
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
Vývoj software pro Linuxové distribuce Installfest Praha,
Vytvoření jednoduchého databázového dotazu Access (7)
Bezpečnostní technologie I
Vypracoval / Roman Málek
Služby Windows Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Libor Otáhalík. Dostupné z Metodického portálu ISSN: 
Moduly.
Letecká informační služba pro GA 2017
„Firemní řešení avast! - rychle, efektivně, jinak“
Operační Systém Operační systém je v informatice základní programové vybavení počítače (tj. software), které je zavedeno do paměti počítače při jeho.
Vlastnosti souborů Jaroslava Černá.
Zajímavé novinky v produktech Open Stanislav Nisler Moravská Třebová
1. ročník oboru Mechanik opravář motorových vozidel
Optimalizace SQL dotazů
software a technické zabezpečení Ladislav Filip
E-learning – moderní elektronická podpora výuky
Transkript prezentace:

Představení PBS Professional Dalibor Klusáček klusacek@cesnet Představení PBS Professional Dalibor Klusáček klusacek@cesnet.cz Václav Chlumský vchlumsky@cesnet.cz

Systém pro správu a přidělování zdrojů úlohám Co to vlastně je PBS? Systém pro správu a přidělování zdrojů úlohám Řídí „životní cyklus“ výpočetní (dávkové) úlohy Submit do fronty, výpočet, dokončení, „úklid“... Řídí souběžný běh úloh na sdíleném HW podle daných kritérií Poskytuje rozhraní pro uživatele a administrátory Je doplněn dalšími službami (webový portál, síťové disky, statistiky, ...) NGI Czech Republic 28.12.2018

Důvody přechodu na PBS Professional Hlavní změny pro uživatele Osnova Důvody přechodu na PBS Professional Časový výhled Hlavní změny pro uživatele Syntaxe „select“ Požadavky na zdroje pomocí „chunků“ Nové možnosti pro efektivní plánování úloh Tipy pro uživatele Další vývoj a plánovaná rozšíření NGI Czech Republic 28.12.2018

PBS Profesional jsme již dříve (za peníze) používali Proč vlastně PBS-Pro? PBS Profesional jsme již dříve (za peníze) používali Přechod na TORQUE umožnil Ušetřit peníze Investovat do rozšíření nabízených služeb Implementovat pokročilé plánovací mechanizmy TORQUE Resource Manager verze 2.4 Námi zásadně rozšířená verze Virtualizace, fair-share, optimalizovaný plánovač úloh Občasné problémy se škálovatelností Adaptive Computing je už na verzi 6.1.0 „Dohnat“ hlavní verzi by bylo obtížné NGI Czech Republic 28.12.2018

Budoucí rozvoj MetaCentra vyžaduje „novou generaci“ dávkového systému Proč vlastně PBS-Pro? Budoucí rozvoj MetaCentra vyžaduje „novou generaci“ dávkového systému Udržitelnost a škálovatelnost Snadný vývoj, aktivní kooperace s vývojáři PBS Professional Podpora nových požadavků a technologií PBS-Pro je od června 2016 open source Valná většina našich rozšíření je přenositelná s rozumným úsilím Elegantní mechanismus tzv. hooků (defacto python pluginy) Rozšířené možnosti specifikace úloh Vysoká (teoretická) propustnost 50K uzlů, 1M jader, > 1M úloh/den Podpora kontejnerů, apod. NGI Czech Republic 28.12.2018

PBS-Pro provoz zahájen na podzim 2016 Časový harmonogram PBS-Pro provoz zahájen na podzim 2016 Masivní přechod zahájen v lednu 2017 Nyní je již dokončen Valná většina funkcí z TORQUE má již ekvivalent v PBS-Pro Navíc nové užitečné vlastnosti (viz dále) Včetně podpůrných nástrojů: PBSMon (webový portál) Sestavovač qsub příkazů Accounting a statistiky, atd. CERIT-SC také postupně přechází na PBS-Pro Část strojů zůstane v TORQUE minimálně do léta 2017 Plný přechod naplánován na +- srpen 2017 NGI Czech Republic 28.12.2018

Časový harmonogram PBSMon ukazuje u každého uzlu příznak „Pro“ pokud je již v PBS Professional NGI Czech Republic 28.12.2018

Vývoj využití infrastruktury MetaCentra Časový harmonogram Vývoj využití infrastruktury MetaCentra (leden – březen 2017) PBS-Pro vs. TORQUE NGI Czech Republic 28.12.2018

Hlavní změny pro uživatele Nová syntaxe programu qsub Zejména příkaz „select“ a další drobné změny „Chunky“ a jejich využití Příklady na wiki, v dokumentaci nebo na letáku NGI Czech Republic 28.12.2018

Příklady (Torque vs. PBS-Pro) Základní změny v qsub Příklady (Torque vs. PBS-Pro) Příkaz „select“ a jiné názvy zdrojů qsub -l nodes=1:ppn=1:gpu=1 qsub -l select=1:ncpus=1:ngpus=1 Neexistence „vlastností“, pouze „booleovské“ zdroje qsub -l nodes=1:ppn=1:property1:^property2 qsub -l select=1:ncpus=1:property=True:property2=False Krátká jména uzlů qsub -l nodes=1:ppn=1:tarkil3.metacentrum.cz qsub -l select=1:ncpus=1:vnode=tarkil3 Explicitní požadavky na zdroje qsub -l nodes=1:ppn=1 –l mem=4gb –l scratch=10gb:any qsub -l select=1:ncpus=1:mem=4gb:scratch_local=10gb NGI Czech Republic 28.12.2018

Příklady (Torque vs. PBS-Pro) Základní změny v qsub Příklady (Torque vs. PBS-Pro) Zákaz explicitního požadavku na „běžné“ fronty q_2h, q_4h, q_1d, q_2d, q_4d, q_1w, q_2w, q_2w_plus Routovaci fronta (default) automaticky vybírá vhodnou frontu podle walltime dané úlohy qsub -l nodes=1:ppn=1 –q q_1d qsub -l select=1:ncpus=1 –l walltime=24:00:00 Nepoužívat zkratky pro walltime Walltime je třeba zadávat ve formátu [[hh:]mm:]ss Formát např. 1w1d2h30m10s není dále podporován qsub -l nodes=1:ppn=1 –l walltime=2d qsub -l select=1:ncpus=1 –l walltime=48:00:00 NGI Czech Republic 28.12.2018

Základní změny – pokračování Dokončená úloha je ve stavu "F“ Nikoliv "C" jak bylo zvykem v TORQUE Příkaz qstat standardně nezobrazuje dokončené úlohy K tomu je třeba použít parametr -x. Příklad: qstat -x -f <jobID> Pole úloh (Job Arrays) Užitečné pro práci s větším množstvím „identických“ úloh Typicky SIMD výpočty, parameter sweep aplikace, atd. Snadné spuštění, modifikace, zobrazení i dotazy nad polem úloh qsub -J X-Y[:Z] ..., X/Y je počáteční/konečný index, Z je krok indexů qsub -J 2-7:2 ... vytvoří indexy 2, 4 a 6 qstat -f 123456'[]' dotaz na celé pole úloh qstat -f 123456'[2]' dotaz na úlohu s indexem 2 NGI Czech Republic 28.12.2018

Chunk je množina zdrojů přidělená „jako nedělitelná jednotka“ úloze „Chunky“ Chunk je množina zdrojů přidělená „jako nedělitelná jednotka“ úloze Všechny zdroje daného chunku budou přiděleny na jednom uzlu (nedělitelnost) Zdroje chunku budou dostupné té části úlohy, která se v daném chunku spustí. Úloha může žádat o více (různých) chunků Příkaz: -l select=[chunk_1][+chunk_2]...[+chunk_n] Příklad: qsub -l select=6:ncpus=2:mem=4gb+3:ncpus=8:mem=4gb ... Dvě množiny různých chunků, první má 6 chunků s 2 CPU/chunk a druhá pak 3 chunky po 8 CPU/chunk, přičemž obě množiny požadují 4GB paměti per chunk NGI Czech Republic 28.12.2018

Základní specifikace zdrojů Paralelní úlohy Základní specifikace zdrojů Počet procesorů pro chunk (ncpus=X) Kolik MPI procesů běží v 1 chunku (mpiprocs=Y) Pro každý MPI proces je jeden řádek v nodefile $PBS_NODEFILE specifikující přidělený vnode Kolik OpenMP vláken běží v 1 chunku (ompthreads=Z) Proměnná $OMP_NUM_THREADS Příklad: qsub -l select=3:ncpus=2:mpiprocs=2 6 MPI procesů (nodefile obsahuje 6 řádků se jmény vnodů) Vždy 2 MPI procesy sdílí 1 vnode s 2 CPU Defaultně 2 omp vlákna na 1 chunk (ompthreads = ncpus) NGI Czech Republic 28.12.2018

Hlavní výhody v PBS-Pro „Kouzla“ s chunky Hlavní výhody v PBS-Pro Oproti TORQUE lze v PBS-Pro specifikovat, jakým způsobem chunky plánovat na uzly Efektivnější využití zdrojů resp. organizace „topologie“ úloh Přesná specifikace umístění a sdílení chunků úlohy pomocí příkazu: -l place=[arrangement][:sharing][:grouping] NGI Czech Republic 28.12.2018

Příklady umístění chunků [arrangement]: „Kouzla“ s chunky Příklady umístění chunků [arrangement]: -l place=free: chunky se mohou rozmísťovat libovolně jak to nejlépe plánovači aktuálně vyhovuje (defaultní chování) -l place=pack: všechny chunky umístit na stejný host (musí být dost velký) -l place=scatter/vscatter: každý chunk umístit na svůj vlastní host/vnode NGI Czech Republic 28.12.2018

arrangement (free/pack/scatter) Příklady s plánováním Plánování s chunky free vs. pack vs. scatter arrangement (free/pack/scatter) NGI Czech Republic 28.12.2018

Příklady s plánováním Plánování s chunky free vs. pack vs. scatter arrangement = free NGI Czech Republic 28.12.2018

Příklady s plánováním Plánování s chunky free vs. pack vs. scatter arrangement = pack Kolize s úlohami - nutno čekat NGI Czech Republic 28.12.2018

Příklady s plánováním Plánování s chunky free vs. pack vs. scatter arrangement = scatter NGI Czech Republic 28.12.2018

Příklady sdílení [sharing]: „Kouzla“ s chunky Příklady sdílení [sharing]: -l place=exclhost: požadavek na exluzivní host -l place=excl: požadavek na exkluzivní vnode (u nás vnode ~ host a proto je jedno, který z těchto parametrů se použije) -l place=shared: typický stav, kdy vnode je sdílen úlohami vnode 1 vnode2 vnode 1 vnode2 excl shared NGI Czech Republic 28.12.2018

Příklady „shlukování“ chunků [grouping]: „Kouzla“ s chunky Příklady „shlukování“ chunků [grouping]: -l place=group=[resource] Zvlaštní „placement“ parametr, který umožňuje požadovat pro všechny chunky resource stejné hodnoty Hodnota je přitom ale libovolná (jen musí být stejná) U nás je zatím užitečné pouze u zdroje infiniband Zde nemusí záležet na tom, kde úloha běží, podstatné je, že je infiniband všude stejný – tj. úloha běží v rámci jedné (libovolné) rychlé sítě Konkrétní infiniband lze jinak klasicky vybrat pomocí: –l select=...:infiniband=X NGI Czech Republic 28.12.2018

Příklady „shlukování“ chunků [grouping]: Příklady s plánováním Příklady „shlukování“ chunků [grouping]: Grouping: -l place=group=infiniband NGI Czech Republic 28.12.2018

Příklady „shlukování“ chunků [grouping]: Příklady s plánováním Příklady „shlukování“ chunků [grouping]: Grouping: -l place=group=infiniband NGI Czech Republic 28.12.2018

Příklady „shlukování“ chunků [grouping]: Příklady s plánováním Příklady „shlukování“ chunků [grouping]: Grouping: -l place=group=infiniband NGI Czech Republic 28.12.2018

Příklady „shlukování“ chunků [grouping]: Příklady s plánováním Příklady „shlukování“ chunků [grouping]: Grouping: -l place=group=infiniband NGI Czech Republic 28.12.2018

Příklady „shlukování“ chunků [grouping]: Příklady s plánováním Příklady „shlukování“ chunků [grouping]: Grouping: -l place=group=infiniband NGI Czech Republic 28.12.2018

Topologické plánování (placement sets) Příklady s plánováním Topologické plánování (placement sets) Použije se pokud je definováno (a žadatel nespecifikuje vlastní preferenci pomocí –l place=group=XY) „Set“ je definován sdíleným zdrojem Plánovač pak postupně zkouší sety od nejmenší k největší NGI Czech Republic 28.12.2018

Topologické plánování (placement sets) Příklady s plánováním Topologické plánování (placement sets) použije se pokud je definováno a žadatel nespecifikuje –l place=group=XY Plánovač pak postupně zkouší sety od nejmenší k největší první (4 uzly) třetí (10 uzlů) čtvrtá (14 uzlů) druhá (6 uzlů) NGI Czech Republic 28.12.2018

Topologické plánování (placement sets) Příklady s plánováním Topologické plánování (placement sets) použije se pokud je definováno a žadatel nespecifikuje –l place=group=XY Prevence „drobení“ výpočtu mezi vzájemně „vzdálené“ uzly NGI Czech Republic 28.12.2018

Jak si sám pomoci s plánováním? Využívat chunky rozumným způsobem „drobení úloh“ (menší chunky snáze naleznou volné zdroje) „shlukovací“ volba „free“ dává větší volnost Používat array joby Snažší správa, modifikace, ... mazání  „Pomáhat“ plánovači ve spouštění úloh Lepší fairshare (via děkování v publikacích) Lepší odhady potřebných zdrojů (CPU, RAM, ...) Lepší odhady walltime NGI Czech Republic 28.12.2018

Jak si sám pomoci s plánováním? Menší a kratší úlohy snáze vyplňují „díry“ v rozvrhu Vysoké využití alokovaných CPU zdrojů 80% úloh spotřebuje alespoň 95% z alokovaných CPU NGI Czech Republic 28.12.2018

Jak si sám pomoci s plánováním? Stále velmi mizerné odhady walltime ~60% úloh požaduje 2h, ~10% úloh požaduje <= 1h přitom ~ 85% úloh skončí během max. 1h NGI Czech Republic 28.12.2018

Chystané novinky v PBS-Pro Podpora nových možností výběru uzlů Vícenásobný select (funguje jako logická volba „OR“) qsub -L select=... –L select=... Filtrování uzlů Příklad: Požadavek na alespoň 10 procesorové uzly mimo Brno qsub -L nfilter=“resources_available[‘ncpus’]>10 and resources_available[‘city’]!=‘Brno’” Podpora kontejnerů PBS-Pro umí spouštět Docker kontejnery Buď interaktivně anebo skriptem My plánujeme nasazení Singularity containers Lepší bezpečnost (neběží pod rootem) Lepší podpora MPI úloh NGI Czech Republic 28.12.2018

Děkuji za pozornost. Dalibor Klusáček klusacek@cesnet Děkuji za pozornost! Dalibor Klusáček klusacek@cesnet.cz Václav Chlumský vchlumsky@cesnet.cz