EGEE is a project funded by the European Union under contract IST Využití EGEE infrastruktury pro zpracování dat ve fyzice vysokých energií CESNET EGEE II seminář,
CESNET EGEE II seminář, Obsah • Projekty částicové fyziky a jejich nároky na IT • Motivace pro grid • EGEE a další projekty • Statistiky, data • Výhled
CESNET EGEE II seminář, Fyzika mikrosvěta Částicová fyzika studuje: elementární částice, ze kterých se skládá všechna hmota ve vesmíru základní síly, které mezi nimi působí Proto potřebuje: speciální nástroje pro vytváření a studium nových částic
CESNET EGEE II seminář, • CERN je největší laboratoř pro částicovou fyziku • ČR je členskou zemí od r (svého vzniku) • CERN je místem, kde se budují největší urychlovače a detektory Co je to CERN? CERN je: ~ 2500 vědeckých zaměstnanců (fyziků, inženýrů, …) Kolem 6500 externích spolupracovníků (polovina všech částicových fyziků ) Přicházejí z 500 univerzit představují 80 národností.
CESNET EGEE II seminář,
LHC data • 40 miliónů srážek za sekundu • Po hrubém výběru se zaznamená 100 zajímavých srážek za sekundu • 1 srážka ~ 1 Megabyte zápis 0.1 Gigabyte/sec • zaznamenaných srážek za rok = 10 Petabyte/rok CMSLHCbATLASALICE 1 Megabyte (1MB) Digitální fotografie 1 Gigabyte (1GB) = 1000MB Film na DVD 1 Terabyte (1TB) = 1000GB Celosvětová produkce knih 1 Petabyte (1PB) = 1000TB Data za 1 rok z 1 LHC experimentu 1 Exabyte (1EB) = 1000 PB Množství informací vyprodukovaných na světě za celý rok
CESNET EGEE II seminář, Z mnoha případů během jedné srážky…... chceme rozpoznat tento případ Výběr: 1 z Jako hledání 1 člověka mezi 1000 násobkem populace Země. Nebo hledat jehlu ve 20 milionech kupek sena! Případy na LHC
CESNET EGEE II seminář, Data z LHC experimentů za 1 rok by bylo možné uložit na 20 milionech CD! Kde budou data skladována a jak budou zpracovávána? LHC data
CESNET EGEE II seminář, • Výpočetní farmy založené na běžných, relativně levných PC • Více než 1000 dvouprocesorových PC • Více než 1 Petabyte dat na discích a páskách To zdaleka nestačí! Výpočty v CERN
CESNET EGEE II seminář, Zpracování dat z LHC Pro analýzu dat z LHC je zapotřebí výpočetního výkonu na úrovni asi 100,000 dnešních rychlých CPU! Kde experimenty najdou tuto výpočetní kapacitu?
CESNET EGEE II seminář, • World Wide Web byl vyvinut v CERN pro usnadnění komunikace mezi fyziky. Typický tým pro jeden velký experiment na počátku 90. let tvořilo asi 500 fyziků, nové experimenty buduje přes 1000 fyziků (plus inženýři, technici a další specialisté) • Pro sdílení dokumentů World Wide Web
CESNET EGEE II seminář, • Grid je infrastruktura, která poskytuje přístup k velkému množství dat a k velkému výpočetnímu výkonu. • Middleware spojuje větší výpočetní střediska, která poskytují hardwarové zdroje. • Cílem je též optimalizovat využití hardwaru: • poskytnu své CPU, když ho nedokáži plně využít • použiju i cizí CPU v době mojí špičky Co je Grid?
CESNET EGEE II seminář, • CERN projekty: LHC Computing Grid (LCG) • Projekty EU vedené CERN: European DataGrid (EDG) Enabling Grids for E-science in Europe (EGEE) CERN se aktivně účastní mnoha gridových projektů CERN
CESNET EGEE II seminář, •Každý uživatel (fyzik) musí mít přístup ke všem datům svého experimentu •Rychlá odezva pro interaktivní práci nad částí dat •Dávkové úlohy pro zpracování velkých souborů •Systém sám ví, kde jsou data a kde je nejvýhodnější úlohy zpracovávat Požadavky na systém
CESNET EGEE II seminář, LCG/EGEE Grid – současný stav
CESNET EGEE II seminář, Data Challenges • DC: Rozsáhlé testy různých komponent • stabilita vlastního software • rozdělování úloh • Grid middleware • propustnost sítí • výkonnost zálohovacích kapacit • počet a připravenost jednotlivých center • příprava souborů dat pro analýzu
CESNET EGEE II seminář, ATLAS – výpočetní příspěvek CZ • – jobů 8931 propočítaných dnů • Datové přenosy CERN Praha a FZK Praha
CESNET EGEE II seminář, ALICE – výpočetní příspěvek CZ • Produkce začala v lednu 2006 • ALICE dobře využila zdroje které jsou jinak vyhrazené jiným experimentům, v době jejich nečinnosti (princip Gridu)
CESNET EGEE II seminář, ALICE – výpočetní příspěvek CZ
CESNET EGEE II seminář, D0 – výpočetní příspěvek CZ • Monte-Carlo produkce a reprocesing • 12mil. eventů produkce, 26mil. eventů reprocessing • jobů, 5% veškeré produkce pro FNAL
CESNET EGEE II seminář, Získané zkušenosti • Systém je i v současném stavu použitelný k hromadným simulacím • Testy odhalily některé problémy a nové požadavky konfigurace a správa farem (černé díry,...) distribuce úloh replikace dat včasná identifikace problémů detailní monitorování
CESNET EGEE II seminář, Shrnutí • Současný middleware poskytuje nutné služby pro zpracování úloh náročných na CPU a datové přenosy • Další vývoj zlepší spolehlivost zvýší škálovatelnost zjednodušší práci uživatele • Požadavky z jiných oborů zkvalitní middleware i pro částicovou fyziku
CESNET EGEE II seminář, Děkuji za pozornost!