Status farmy Goliáš Jan Švec,
Farma goliáš nyní ● LP1000r 2xPIII-1.13 GHz 512k 1GB RAM 18GB SCSI HDD (34 ks) ● 10TB (1 + 9) diskové kapacity ● Využití pro experimenty D0, ATLAS, ALICE
Disková kapacita ● 2 disková pole ● /raid – 1TB Ultra160 SCSI disky – ext3 filesystem, RAID5 ● /raid3_x – 9TB UltraATA 133 disky – ext3 filesystem (XFS), RAID5 ● zálohování důležitých dat na LTO pásky
Síťová konektivita ● Propojení uzlů 100Mbps ● Disková pole 1Gbps ● router.farm.particle.cz – 1 Gbps do Pasnetu – 100 Mbps do Czechlight -> Translight -> CERN
Rozšíření v roce 2004 ● výstavba nové serverovny ● dokončení v červnu 2004 ● zálohované napájení (UPS, diesel) – 200kVA ● klimatizace ● optické připojení do Pasnetu ● 18 racků, zdvojené podlahy,...
Rozšíření v roce 2004 (2) ● probíhá výběrové řízení ● nákup minimálně 35 serverů (možná až 45) – 2x AMD Opteron 1.6GHz, 2GB RAM – 2x Intel Xeon 3.06GHz HT, 2GB RAM ● 1x Intel Xeon 2.8GHz jako golias.farm.particle.cz ● diskové pole 20-30TB, část jako backup, ATA disky, RAID5 ● magnetopásková LTO knihovna 200TB ● celkové navýšení výkonu přibližně o 300%
Rozšíření v roce 2004 (3) ● propojení nových uzlů na úrovni 1Gbps ● povýšení připojení do Czechlight na 1Gbps (začátek dubna) ● připojení dalších institucí k výpočetním prostředkům ve FZÚ pomocí sítě Czechlight (minimálně na úrovni 1Gbps) ● připojení přes Czechligh do FNAL (přes Starlight)
Spouštění jobů na farmě ● batch systém PBSPro – možnost spouštět i interaktivní joby – nevyhovující scheduler – problém se změnou licenční politiky ● v rámci přechodu na LCG2 možný přesun na OpenPBS ● náhrada PBS scheduleru za jiný (Maui) ● 48 procesorů (12 dočasně použito pro instalaci LCG1, bude začleněno zpět)
Fronty v PBS ● řazení podle priorit – funguje na nově spouštěné joby – možnost suspendování jobu -> ne vždy vyhovuje – možnost specifikovat požadavek na celý node ● 6 front – obecné ● shortq ● normalq ● longq – pro daný experiment ● d0 (50%) ● atlas ● alice
Současné využití a blízká budoucnost ● LCG1 -> přechod na LCG2 (v nejbližších dnech) – pravděpodobná migrace celé farmy na LCG2 – možnost zadávat joby jak do lokálních front tak do LCG2 z jednoho interfacu ● Alice DC – téměř neustálé využití kolem 40% farmy ● D0 simulace (problém s kontrolou jobů) ● Atlas DC2 – poběží v rámci gridů (LCG2) – odhadovaný začátek 1. května
Informační kanály ● ATLAS tutoriály – hep2.fzu.cz/~chudoba/atlas/tutorial2003/ ● mailing listy – – ● web farmy –