EGEE is a project funded by the European Union under contract IST-2003-508833 Využití EGEE infrastruktury pro zpracování dat ve fyzice vysokých energií.

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Podpora personálních procesů v HR Vema Jaroslav Šmarda
™. ™ Zprovoznění zařízení a zahájení jejich řízení během několika minut.
Název materiálu: OPAKOVÁNÍ 2. POLOLETÍ - OTÁZKY
VN zdroj pro TILECAL vila Lanna
Senior IT operations manager
Produkce odpadů 2002 – 2007 obce ORP Šumperk
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 4 Vytvořila: Mgr. Martina Bašová VY_32_Inovace/1_028.
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
Monitorovací systém Asistent
Regionální výpočetní centrum pro fyziku částic Farma Goliáš
Status farmy Goliáš Jan Švec, Farma goliáš nyní ● LP1000r 2xPIII-1.13 GHz 512k 1GB RAM 18GB SCSI HDD (34 ks) ● 10TB (1 + 9) diskové kapacity.
Zpracování dat – superpočítačové výkony na běžných procesorech Fyzikální ústav AV ČR.
EGEE is a project funded by the European Union under contract IST Využití EGEE infrastruktury pro zpracování dat ve fyzice vysokých energií.
DIGITÁLNÍ MAPOVÝ ARCHIV -moderní přístup k informacím (archiv ČGS) Alena Čejchanová Klára Jančová Archiv České geologické služby.
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
49. mistrovství světa ve zpracování textu na počítači
Magnetohydrodynamický (MHD) generátor
PROGRAM PRO VÝUKU T ČLÁNKU
INFSO-RI Enabling Grids for E-sciencE VOCE Status Jan Kmuníček CESNET, Česká republika.
INFSO-RI Enabling Grids for E-sciencE Aktuální způsob využití EGEE zdrojů Jan Kmuníček Pokročilý seminář EGEE, 16. prosince 2004.
INFSO-RI Enabling Grids for E-sciencE Použití farmy SKURUT v roce 2004 Jiří Chudoba, Lukáš Fiala, Miloš Lokajíček, Jiří Kosina,
Přínosy virtualizace a privátního cloudu
Siemens PLM Software © Siemens Product Lifecycle Management Software Inc. All rights reserved Využití CAM Express pro řízení obráběcích strojů a.
Dynamické rozvozní úlohy
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Kdo chce být milionářem ?
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Tematická oblast: Hardware, software a informační sítě
Lukáš Fiala FZÚ AV ČR. Dnešní stav seminář CESNETu - Sezimovo Ústí2 střed hvězdy je Cisco C6503 na CESNETu vyhrazená GN2 lambda pro spoj do.
Identifikátor materiálu: EU
Status farmy Goliáš Jan Švec, Farma goliáš nyní ● LP1000r 2xPIII-1.13 GHz 512k 1GB RAM 18GB SCSI HDD (34 ks) ● 10TB (1 + 9) diskové kapacity.
Získávání informací Získání informací o reálném systému
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Seminář CESNET 1 Zpracování dat v částicové fyzice Jiří Chudoba FZÚ AV ČR.
Lenka Fialová Martina Procházková Ondřej Soukup Martin Valenta Cyril Vojáček 1.
Jazyk vývojových diagramů

Nejmenší společný násobek
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
EGEE is a project funded by the European Union under contract IST Gridy a související aktivity v CR Jiří Kosina Seminář projektu EGEE,
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Slide 1 A Free sample background from © 2003 By Default! Jiří Kůsa Testování propustnosti síťového firewallu.
VZDĚLÁVÁNÍ ÚČASTNÍKŮ KOMUNITNÍHO PLÁNOVÁNÍ SOCIÁLNÍCH SLUŽEB VE SPRÁVNÍCH OBVODECH HL. MĚSTA PRAHY.
INFSO-RI Enabling Grids for E-sciencE Charon Extension Layer (CEL) Jan Kmuníček CESNET.
ATLAS Computing Jiří Chudoba Fyzikální ústav AV ČR, v.v.i.
Téma: ABSOLUTNÍ HODNOTA CELÝCH ČÍSEL 2
Název materiálu: OPAKOVÁNÍ 1.POLOLETÍ - OTÁZKY
Jazyk vývojových diagramů
Mgr. Miroslava Černá ZŠ Volgogradská 6B, Ostrava-Zábřeh
E-knihovna pro knihovníky Seminář E-knihy III, NTK,
Název materiálu: OPAKOVÁNÍ 1.POLOLETÍ - OTÁZKY
Aplikace DVB-T Český Telecom, a.s.. 2 Agenda DVB-T MHP Platforma ČTc DVB-T MHP Platforma ČTc – aplikace Shrnutí cílů společnsti Český Telecom, a.s.
1 © Mediaresearch, a.s., 2008 NetMonitor a AdMonitoring Výsledky za říjen 2008.
Přednost početních operací
Rozvoj nehlasových služeb Současnost a budoucnost mobilních sítí
Autor: Ondřej Šimeček Verze: 1.1.3
Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou I NFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Ing. Jan Roubíček.
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.1 Lucián Piller Intranet HR.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Distribuce dat experimentu ATLAS Jiří Chudoba.
EGEE is a project funded by the European Union under contract IST Gridové projekty LCG a D0 v ČR Jiří Kosina Fyzikální ústav AV ČR Seminář.
Návrh nákupu nákladných přistrojů v roce 2004 Zvýšení výkonu linuxové farmy GOLIÁŠ pro zpracování dat.
LCG2 LCG2 software Jiří Kosina. LCG2 – přehled ●... některé slajdy budou podobné loňským... ● ● GRID, který bude sloužit ke zpracování.
Vypracoval / Roman Málek
Distribuovaná Analýza ATLAS dat
Transkript prezentace:

EGEE is a project funded by the European Union under contract IST Využití EGEE infrastruktury pro zpracování dat ve fyzice vysokých energií Jiří Chudoba CESNET EGEE seminář,

CESNET EGEE seminář, Obsah Projekty částicové fyziky a jejich nároky na IT Motivace pro grid EGEE a další projekty Data Challenges Výhled

CESNET EGEE seminář, Fyzika mikrosvěta Částicová fyzika studuje: elementární částice, ze kterých se skládá všechna hmota ve vesmíru základní síly, které mezi nimi působí Proto potřebuje: speciální nástroje pro vytváření a studium nových částic

CESNET EGEE seminář, CERN je největší laboratoř pro částicovou fyziku ČR je členskou zemí od r (svého vzniku) CERN je místem, kde se budují největší urychlovače a detektory Co je to CERN? CERN je: ~ 2500 vědeckých zaměstnanců (fyziků, inženýrů, …) - Kolem 6500 externích spolupracovníků (polovina všech částicových fyziků ) Přicházejí z 500 univerzit představují 80 národností.

CESNET EGEE seminář,

LHC data 40 miliónů srážek za sekundu Po hrubém výběru se zaznamená 100 zajímavých srážek za sekundu 1 srážka ~ 1 Megabyte zápis 0.1 Gigabyte/sec zaznamenaných srážek za rok = 10 Petabyte/rok CMSLHCbATLASALICE 1 Megabyte (1MB) Digitální fotografie 1 Gigabyte (1GB) = 1000MB Film na DVD 1 Terabyte (1TB) = 1000GB Celosvětová produkce knih 1 Petabyte (1PB) = 1000TB Data za 1 rok z 1 LHC experimentu 1 Exabyte (1EB) = 1000 PB Množství informací vyprodukovaných na světě za celý rok

CESNET EGEE seminář, Z mnoha případů během jedné srážky…... chceme rozpoznat tento případ Výběr: 1 z Jako hledání 1 člověka mezi 1000 násobkem populace Země. Nebo hledat jehlu ve 20 milionech kupek sena! Případy na LHC

CESNET EGEE seminář, Data z LHC experimentů za 1 rok by bylo možné uložit na 20 milionech CD! Kde budou data skladována a jak budou zpracovávána? LHC data

CESNET EGEE seminář, Výpočetní farmy založené na běžných, relativně levných PC Více než 1000 dvouprocesorových PC Více než 1 Petabyte dat na discích a páskách To z daleka nestačí! Výpočty v CERN

CESNET EGEE seminář, Zpracování dat z LHC Pro analýzu dat z LHC je zapotřebí výpočetního výkonu na úrovni asi 100,000 dnešních rychlých CPU! Kde experimenty najdou tuto výpočetní kapacitu?

CESNET EGEE seminář, Výpočty pro LHC: problém? Grid je možným řešením!

CESNET EGEE seminář, World Wide Web byl vyvinut v CERN pro usnadnění komunikace mezi fyziky. Typický tým pro jeden velký experiment na počátku 90. let tvořilo asi 500 fyziků, nové experimenty buduje přes 1000 fyziků (plus inženýři, technici a další specialisté) Pro sdílení dokumentů World Wide Web

CESNET EGEE seminář, Grid je infrastruktura, která poskytuje přístup k velkému množství dat a k velkému výpočetnímu výkonu. Middleware spojuje větší výpočetní střediska, která poskytují hardwarové zdroje. Cílem je též optimalizovat využití hardwaru: poskytnu své CPU, když ho nedokáži plně využít použiju i cizí CPU v době mojí špičky Co je Grid?

CESNET EGEE seminář, CERN projekty: LHC Computing Grid (LCG) Projekty EU vedené CERN: European DataGrid (EDG) Enabling Grids for E-science in Europe (EGEE) Projekty ve spolupráci s průmyslem: CERN Openlab for DataGrid applications CERN se aktivně účastní mnoha gridových projektů CERN

CESNET EGEE seminář, Každý uživatel (fyzik) musí mít přístup ke všem datům daného experimentu Rychlá odezva pro interaktivní práci nad částí dat Dávkové úlohy pro zpracování velkých souborů Systém sám ví, kde jsou data a kde je nejvýhodnější úlohy zpracovávat Požadavky na systém

CESNET EGEE seminář, Simulace: Malý vstup, velký výstup Velké nároky na CPU Oficiální software pro všechny úlohy Rekonstrukce: Mnoho dat na vstupu, méně na výstupu Oficiální software Analýza: Na vybrané zlomky dat Každý uživatel může mít jiný software Výsledky “brzy” Simulace, Rekonstrukce, Analýza

CESNET EGEE seminář, Data Challenges DC: Rozsáhlé testy různých komponent stabilita vlastního software rozdělování úloh Grid middleware propustnost sítí výkonnost zálohovacích kapacit počet a připravenost jednotlivých center příprava souborů dat pro analýzu

CESNET EGEE seminář, Před Gridem Éra urychlovače LEP ( )  hlavní výpočetní kapacita v CERN  část simulací se prováděla v jiných centrech –předem definované vzorky –transport pomocí pásek  export vybraných částí dat na páskách (později přes síť) do lokálních center pro analýzu dat ATLAS DC 1 proběhla v  rozdělení úloh předem dle velikosti center  každý lokální administrátor musel provést instalaci a úpravy spouštěcích skriptů dle lokálních podmínek  dlouhé čekání na dokončení úloh z center, kde se vyskytli problémy, zatímco jinde už byly procesory nevyužité

CESNET EGEE seminář, ATLAS DC LCG Instalace ATLAS sw pomocí instalační úlohy (1 člověk pro všechna centra) Posílání úloh polo-automaticky, teoreticky 1 člověk (v praxi více – stálý vývoj, dovolené, dozorování problémových úloh) Výsledky se kopírují na předem zadaná zařízení (centra s backupem na páskové jednotky) Maximální využití všech dostupných kapacit se nedařilo, ale někdy jsme se k němu blížili

CESNET EGEE seminář, ATLAS DC LCG Typy úloh:  generování případů – žádný vstup, malý výstup, malé nároky na CPU  simulace odezvy detektoru – vstupem jsou generované případy (nutnost jejich distribuce), objemný výstup, náročné na CPU  digitalizace – zpracování výstupu ze simulace  pile-up = smíchání případů - vstupní množina 700 GB, pro jednu úlohu několik GB  míchání signálu s pozadím  rekonstrukce Celkem 10 % nároků po spuštění LHC 10 milionů případů

CESNET EGEE seminář, ATLAS DC2 Používá 3 různé gridy  LCG2 ( = EGEE )  GRID3 (US)  Nordugrid (vychází z EDG - předchůdce EGEE)

CESNET EGEE seminář, Zapojená centra v DC

CESNET EGEE seminář, Počet ATLAS úloh

CESNET EGEE seminář, Použité CPU farma GOLIAS

CESNET EGEE seminář, Monitorování

CESNET EGEE seminář, ATLAS: Chyby v LCG

CESNET EGEE seminář, ATLAS DC2 – současný stav Stále ještě probíhá, dosavadní výsledky od července 2004 do počátku října:  22 různých transformací (různé typy úloh)  157 „úkolů“ (aplikace transformace na různá data)  spuštěných úloh  zaregistrovaných logických souborů  spotřebováno 5000 CPU měsíců Průběžné opravy ATLAS SW, LCG dovoluje koexistenci několika verzí

CESNET EGEE seminář, ALICE DC LCG2 a AliEn Časově se překrývala s ATLAS DC 1. fáze: Simulace Pb+Pb případů s různými impakt parametry + produkce p+p případů  Počet úloh: 6 x případů (typ cent1/per1-5) = úloh – úloh á 8 hodin (cent 1) – úloh á 5 hodin (per 1), – úloh á 2.5 hodiny (per2-per5)  Počet souborů: ~36 souborů z každé úlohy AliEn file catalogue: ~2.0 milionů souborů CERN Castor: 1.3 milionů  Velikost souborů: Celkem: 26 TB

CESNET EGEE seminář, ALICE DC – 2. fáze Míchání případů s různým signálem s Pb+Pb případy Test:  Standardní produkce (relativně malých) případů se signálem  Kapacity sítě a nástrojů na transport souborů  Stabilita vzdálených SE Podmínky, úlohy …:  62 různých podmínek  340K úloh, 15.2M případů  10 TB produkovaných dat  200 TB dat přenesených z CERN  500 MSI2K hodin CPU

CESNET EGEE seminář, Rozdělení CPU 16 AliEn farem + LCG

CESNET EGEE seminář, Získané zkušenosti Systém je i v současném stavu použitelný k hromadným simulacím Testy odhalily některé problémy a nové požadavky  konfigurace a správa farem (černé díry,...)  distribuce úloh  replikace dat  včasná identifikace problémů  detailní monitorování  problémy klíčových komponent  podpora zacházení s mnoha úlohami

CESNET EGEE seminář, Shrnutí Současný middleware poskytuje nutné služby pro zpracování úloh náročných na CPU a datové přenosy Další vývoj  zlepší spolehlivost  zvýší škálovatelnost  zjednodušší práci uživatele Požadavky z jiných oborů zkvalitní middleware i pro částicovou fyziku

CESNET EGEE seminář, Děkuji za pozornost!