Distribuovaná Analýza ATLAS dat

Slides:



Advertisements
Podobné prezentace
™. ™ Zprovoznění zařízení a zahájení jejich řízení během několika minut.
Advertisements

EGEE is a project funded by the European Union under contract IST Využití EGEE infrastruktury pro zpracování dat ve fyzice vysokých energií.
 EBSCOhost Collection Manager Přehled funkcí účtu Selector 3. července 2013.
DSpace zkušenosti se zaváděním systému na Univerzitě Pardubice Seminář Systémy pro zpřístupňování eVŠKP 2007 Brno Lucie Vyčítalová Univerzitní.
Regionální výpočetní centrum pro fyziku částic Farma Goliáš
Status farmy Goliáš Jan Švec, Farma goliáš nyní ● LP1000r 2xPIII-1.13 GHz 512k 1GB RAM 18GB SCSI HDD (34 ks) ● 10TB (1 + 9) diskové kapacity.
Zpracování dat – superpočítačové výkony na běžných procesorech Fyzikální ústav AV ČR.
EGEE is a project funded by the European Union under contract IST Využití EGEE infrastruktury pro zpracování dat ve fyzice vysokých energií.
Instalace ATLAS software 7.02 ● 5 – 10 minut ● 2 způsoby
Skupinová politika Windows 200x - požadavky
SOFTWARE dálkové studium PODNIKÁNÍ 2. listopad 2006.
Jdeme do hloubky: týdenní report
INFSO-RI Enabling Grids for E-sciencE VOCE Status Jan Kmuníček CESNET, Česká republika.
INFSO-RI Enabling Grids for E-sciencE Aktuální způsob využití EGEE zdrojů Jan Kmuníček Pokročilý seminář EGEE, 16. prosince 2004.
INFSO-RI Enabling Grids for E-sciencE Project EGEE-II / VOCE Jan Kmuníček CESNET.
INFSO-RI Enabling Grids for E-sciencE Použití farmy SKURUT v roce 2004 Jiří Chudoba, Lukáš Fiala, Miloš Lokajíček, Jiří Kosina,
IS V EKONOMICKÝCH SUBJEKTECH Ing. Jiří Šilhán. IS IS – data+lidi+HW, prvky + relace mezi uživateli, které splňují nějaké cílové chování – tak aby byly.
Úvod. Základní úrovně: hardwarová (procesory, jádra) programová (procesy, vlákna) algoritmická (uf... ) Motivace: zvýšení výkonu redundance jiné cíle,
Přínosy a druhy počítačových sítí. Jednou z nejvýznamnějších technologií používaných v oblasti výpočetních systémů jsou již řadu let počítačové sítě.
Lukáš Fiala FZÚ AV ČR. Dnešní stav seminář CESNETu - Sezimovo Ústí2 střed hvězdy je Cisco C6503 na CESNETu vyhrazená GN2 lambda pro spoj do.
Status farmy Goliáš Jan Švec, Farma goliáš nyní ● LP1000r 2xPIII-1.13 GHz 512k 1GB RAM 18GB SCSI HDD (34 ks) ● 10TB (1 + 9) diskové kapacity.
Týmová spolupráce s využitím Google Code
Prostředí pro tvorbu strukturovaných učebních textů Ing. Jiří Přibil Fakulta managementu VŠE Rozvojový grant Ministerstva školství, mládeže a tělovýchovy.
Seminář CESNET 1 Zpracování dat v částicové fyzice Jiří Chudoba FZÚ AV ČR.
Spolupráce lokálních institucí Seminář Komunitní role veřejných knihoven ZLÍN
Analýza dat z pixelových detektorů ozářených svazky částic Magdaléna Bazalová Vedoucí práce: Václav Vrba Fyzikální ústav, AV ČR.
EGEE is a project funded by the European Union under contract IST Gridy a související aktivity v CR Jiří Kosina Seminář projektu EGEE,
Slide 1 A Free sample background from © 2003 By Default! Jiří Kůsa Testování propustnosti síťového firewallu.
Meta.cesnet.cz METACentrum – Český národní gridový projekt Projekt METACentrum Jan Kmuníček ÚVT MU & CESNET.
INFSO-RI Enabling Grids for E-sciencE Charon Extension Layer (CEL) Jan Kmuníček CESNET.
ATLAS Computing Jiří Chudoba Fyzikální ústav AV ČR, v.v.i.
Sdílení obsáhlých souborů na webu Výpočetní technika.
Serverové systémy Windows
Mgr. Rostislav Krušinský VĚDECKÁ KNIHOVNA V OLOMOUCI Služba EOD - Elektronické knihy na objednávku.
POČÍTAČOVÁ GRAFIKA VY_32_INOVACE_F3-03 AUTOR: Mgr. Vladimír Bartoš
seminář CESNET2 Masarykova kolej 1 Výpočty ve fyzice částic - projekt ATLAS M. Lokajíček Fyzikální ústav AV ČR.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Distribuce dat experimentu ATLAS Jiří Chudoba.
Reforma českého zdravotnictví poznámky a připomínky
Systémová integrace Big Data
EGEE is a project funded by the European Union under contract IST Gridové projekty LCG a D0 v ČR Jiří Kosina Fyzikální ústav AV ČR Seminář.
Rastrová grafika Výpočetní technika.
Challenges pro METACentrum. Hlavní úkoly Plná integrace různých přístupů k řízení Gridů –Mezinárodní projekty (EGEE) Rozvoj bezpečnostně orientovaného.
Tier2 centrum v Praze Jiří Chudoba Fyzikální ústav AV ČR, v.v.i.
Modely uživatelských preferencí. Obsah Jak se vyjadřují preference Modely preferencí a jejich učení Model založený na atributech Kolaborativní filtrování.
Systém PBS na farmě goliáš Jan Švec Systém PBS (1) ● Portable batch system – e.pdf ●
Počítačové komponenty Jiří Vohradský. Co je počítač? Počítač je zařízení pro zpracování informací. Informace jsou v počítači ve formě různých druhů dat.
Návrh nákupu nákladných přistrojů v roce 2004 Zvýšení výkonu linuxové farmy GOLIÁŠ pro zpracování dat.
LCG2 LCG2 software Jiří Kosina. LCG2 – přehled ●... některé slajdy budou podobné loňským... ● ● GRID, který bude sloužit ke zpracování.
INFSO-RI Enabling Grids for E-sciencE Data Management Jiří Kosina CESNET.
Pevný disk (HDD - Hard Disk Drive)
Přístup do IS z mobilních zařízení Tomáš Tureček Katedra Informatiky FEI VŠB-TU Ostrava.
POJMY A VLASTNOSTI OS: UŽIVATELSKÉ ROZHRANÍ: Prostředí, v němž se uživatel OS pohybuje ( př. textové rozhraní, „okna“ MULTITASKING: Funkce umožňující souběžné.
14. června 2004Michal Ševčenko Architektura softwarového systému DYNAST Michal Ševčenko VIC ČVUT.
Anotace Žák definuje základní SW Autor Petr Samec Jazyk Čeština Očekávaný výstup Dokáže definovat základní software Speciální vzdělávací potřeby Ne Klíčová.
Základní pojmy Standard síťového hardwaru
Publikujeme s Autodesk MapGuide v.5.0 Ing. Jan Růžička, Dr. Ing. Jiří Horák VŠB-Technická univerzita Ostrava
E- MAIL Ing. Jiří Šilhán. E LEKTRONICKÁ POŠTA NEBOLI vývoj od počátku sítí – původní návrh pouze pro přenos krátkých textových zpráv (ASCII) základní.
Příspěvek k workshopu Propagace moderních výukových metod MUDr. Jitka Feberová, Ph.D. knihovna.cuni.cz.
Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Pevný disk Číslo DUM: III/2/VT/2/1/06 Vzdělávací předmět: Výpočetní technika Tematická oblast: Hardware.
Zálohování dat. Zálohování dat (podle CHIP) důvody zálohování – problémy HW, SFTW, viry, chyby uživatele, viry, hackeři, přírodní katastrofy, krádeže.
Datové centrum sociálních služeb v Libereckém kraji Interaktivní softwarový program určený pro poskytovatele sociálních služeb, zadavatele a také pro.
Stránkování MATĚJ JURIČIČ 2015/2016 EP1 SPŠ A VOŠ JANA PALACHA KLADNO.
Vypracoval / Roman Málek
Letecká informační služba pro GA 2017
Segmentace Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Libor Otáhalík. Dostupné z Metodického portálu ISSN: 
Jednotky dat Informatika, 8. třída.
Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Internetové služby – Disk Google Číslo DUM: III/2/VT/2/2/36 Vzdělávací předmět: Výpočetní technika Tematická.
Přednášky z distribuovaných systémů
Přednášky z Distribuovaných systémů
Transkript prezentace:

Distribuovaná Analýza ATLAS dat 12.9.2006 Distribuovaná Analýza ATLAS dat Jiří Chudoba 4.9.2008 Fyzikální ústav AV ČR, v.v.i. Jiri.Chudoba@cern.ch

Model pro ATLAS Distribuované zpracování dat na gridu 12.9.2006 Model pro ATLAS Distribuované zpracování dat na gridu Hierarchie výpočetních center Tier0 – CERN Tier1 – 10 center pro ATLAS Tier2 – asi 30 center Tier3 – menší „příležitostná“ centra Farma Goliáš na FZÚ – Tier2 centrum přiřazené do GridKa regionu (Tier1 v Karlsruhe) Gridový software projektů EGEE, OSG a NorduGrid Model detailně popsán v ATLAS Computing TDR, CERN/LHCC/2005-022 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Tier2 centrum ve FZU Podepsané WLCG MoU v roce 2008 12.9.2006 Tier2 centrum ve FZU Podepsané WLCG MoU v roce 2008 Do roku 2008 včetně větší podíl ALICE než ATLAS. Nyní se vybírá hardware pro splnění závazků na rok 2009. 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Velikosti dat v MB/případ 12.9.2006 Data v roce 2008 Velikosti dat v MB/případ 50,000 sec@200Hz 10 M případů/den 60 dní v 2008: 600M případů V T0: 960 TB RAW to tape 96 TB RAW to disk (10%) 600 TB ESD to tape 60 TB ESD to disk (10%) 120 TB AOD to disk and tape 120 TB DPD to disk and tape 6TB TAG to disk V rámci každého oblaku kompletní soubor AOD v Tier 2 centrech (plus kopie v T1) V typickém Tier2 – 25 % AOD + DPD Ve FZU: asi 5 - 10 % AOD + DPD TDR Nyní RAW 1.6 ESD .5 1. AOD .1 .2 TAG .001 .01 D1PD T0 a T1 nebudou (?) přístupná běžným uživatelům, jen pro organizované produkce 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Kam s daty – space tokens 12.9.2006 Kam s daty – space tokens token name storage type used for @T2 @T1 @T0 ATLASDATATAPE T1D0 RAW data, ESD, AOD from re-proc X ATLASDATADISK T0D1 ESD, AOD from data ATLASMCTAPE HITS from G4, AOD from ATLFAST ATLASMCDISK AOD from MC ATLASPRODDISK buffer for in-and export ATLASGROUPDISK DPD ATLASUSERDISK User Data X *) ATLASLOCALGROUPDISK Local User Data @T3 prevzato z Kors Bos: ATLAS T1/T2/T3 Jamboree, srpen 2008 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Data v typickém Tier2, rok 2008 12.9.2006 Data v typickém Tier2, rok 2008 Typické = 500 CPU a 100 TB pro ATLAS ATLASDATADISK (60 TB) AOD a DPD dle požadavků (nebo podílu), možno i vzorky RAW a ESD ATLASGROUPDISK (6 TB) pro analýzu organizovanou fyzikálními skupinami ATLASUSERDISK (5 TB) scratch space for users ATLASLOCALGROUPDISK (zdroje mimo MoU) permanentní prostor pro lokální uživatele Nyní ve FZU pro ATLAS ATLASUSERDISK – 800 GB ATLASPRODDISK – 500 GB ATLASDATADISK – 2500 GB ATLASMCDISK – 500 GB Zvětšení „space tokens“ o několik TB (dohromady) možné téměř ihned. Celkem pro ATLAS zhruba 20 TB. 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Datové formáty RAW = raw data ESD = Event Summary Data 12.9.2006 Datové formáty RAW = raw data ESD = Event Summary Data detaily z rekonstrukce případů, možno z nich dělat identifikaci částic, refitování drah, rekonstrukci jetů cílová velikost 500 kB, nyní přes 600 kB. calorimeter cells = 270 kB, tracking data 200 kB – pro top případy AOD = Analysis Object Data vytvářeny pouze z ESD, určené pro analýzu nyní 200 kB/případ, plus 60 kB MC truth 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

DPD = Derived Physics Data 12.9.2006 Zkušenost z „Rome produkce“ AOD příliš velké pro analýzu Skupiny používaly hlavně ntuply vytvořené pomocí EventView, HighPtView, TopView DPD = Derived Physics Data DPD – podmnožina obsahu ESD a AOD s možným přidáním analyzačních dat Analyzační data – veličiny vypočítané z ESD a AOD Několik verzí DPD: D1PD, D2PD, D3PD, performance DPD Redukce velikosti dat pomocí: skimming – vynechání celých případů thinning – vynechání některých objektů slimming – vynechání části objektů 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Dnešní možnosti pro analýzu 12.9.2006 Dnešní možnosti pro analýzu 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

12.9.2006 Zdroj: Johannes Elmsheuser, srpen 2008 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Co je k analýze zapotřebí? 12.9.2006 Co je k analýze zapotřebí? UI = User Interface (třeba lxplus) a členství v ATLAS VO Návody na spouštění analýzy na Twiki stránkách Organizují se výukové semináře Veškeré datové přenosy přes systém DQ2 Distribuce oficiálních dat pomocí „subscriptions“ na místa registrovaná v TiersOfATLAS (TOA) Uživatelské datasety nyní není možné takto distribuovat (politické rozhodnutí), ale je možné je kopírovat na vlastní disk Výstup analyzační úlohy na USERDISK, bude pravidelně promazáván Uživatel ho může dát na LOCALGROUPDISK – permanentní prostor skupiny si mohou ve svých Tier přidat diskový prostor Přístup k ESD zatím není vyřešen (povolit úlohy uživatelů v T1 ?) Spolehlivost gridových komponent není 100 %, problémy při velkých kolekcích úloh Zmínit současnou situaci v Praze 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch

Zdroje ATLAS Offline software výukový seminář: 12.9.2006 Zdroje ATLAS Offline software výukový seminář: http://indico.cern.ch/conferenceDisplay.py?confId=39198 Distributed Analysis Workshop 25.-27.8.2008 v CERN http://indico.cern.ch/conferenceDisplay.py?confId=38560 Ganga výuka https://twiki.cern.ch/twiki/bin/view/Atlas/GangaTutorial5 Pathena výuka http://cdsweb.cern.ch/record/1118219 Analysis Model Forum Report, ATL-GEN-INT 2008-01 4.9.2008 Jiri.Chudoba@cern.ch Jiri.Chudoba@cern.ch