Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Modul 3 Servery Verze 1.0 21. září 2011.

Podobné prezentace


Prezentace na téma: "Modul 3 Servery Verze 1.0 21. září 2011."— Transkript prezentace:

1 Modul 3 Servery Verze 1.0 21. září 2011

2 Přehled standardní serverové technologie

3 Spotřeba energie a potenciál úspor u serverů v datových centrech
Spotřeba energie servery dosahuje v datových centrech přibližně 30-40% jejich celkové energetické spotřeby; Opatření založená na hardwaru (například správa napájení) mohou zlepšit energetickou účinnost o 15 až 30%; Opatření založené na softwaru včetně virtualizace dovoluje uspořit i více než 90% energie v těch oblastech, kde lze virtualizaci efektivně použít; Pozitivní jevy se zdvojnásobují na úrovni napájecích zdrojů a chlazení;

4 Typy serverů v datových centrech
Server types used in data centres are typically of the four general form factors tower, rack, blade and mainframe. Mainframe servers are especially designed for high resilience and throughput and use proprietary operating systems, most of which are based on Unix and a growing number on Linux employed. Servers are often used for applications including bulk data processing, process control, industry and consumer statistics, enterprise resource planning, and financial transaction processing. Most common server types in data centres are rack and blade form factors. Thus further considerations are focussing on these server types. Tower (věž) Zařízení do racku Blade server Mainframe (sálový počítač)

5 Servery do racku a věžové servery
Rack servers based on x86 platform are still dominant in all types of DC business and will maintain high market relevance in the future. Rack servers are designed for arrangement in standardized 19-inch mounting rack or cabinets. The servers have expansion slots known as mezzanine slots, for adding network interface cards (NICs) or Fibre Channel host bus adapter (HBA) cards. Compared to tower servers rack servers allow efficient use of floor space, offer centralized cabling and server management and increase scalability increase infrastructure scalability. Rack server models are available from 1U[1] to 8U (and larger) form factors. [1] rack unit or U: unit of measure used to describe the height of equipment intended for mounting in a 19-inch rack, 1 U is 1.75 inches (44.45 mm) high. Performance of rack servers covers a wide spectrum – starting from entry level to the mid-range level. The current product range from entry level servers to mid-range servers typically provide 1- 8 CPUs with two to six cores operating at speeds of up to 3 GHz and above Tower servers are upright free-standing units containing all basic server components and commonly equipped with direct attached storage (DAS). This server type generally requires more floor space than blades or rack-mounted servers and offers less scalability thus representing entry level server products. Tower servers based on x86 platform represent the entry level category for enterprise server products. On the very low end this server type is offered as desktop derived server equipped with components commonly used in PCs(e.g. CPU, hard disks, and power supplies) This type of servers is mainly used in small offices. ENERGY STAR defines this server type as “small scale server”. Small-Scale Servers are designed to perform functions such as network infrastructure services (e.g., archiving) and data/media hosting. The products are not designed to process information for other systems or run web services as a primary function. Energy Star specifies energy efficiency criteria for small scale servers including power consumption in idle and off mode as well as power supply efficiency. Server určený pro montáž do IT rozvaděče (19“ racku) – pohled zpředu (nahoře) a pohled zezadu (dole) Věžové provedení serveru (Tower) – pohled zpředu

6 Typický rám (chassis) blade serveru
Blade chassis, blade servery, víceuzlové servery - ukázka částečně vytaženého blade modulu pohled zpředu Blade servers consist of a blade chassis also called enclosure and server blades mounted into the chassis. Blade servers allow to arrange high computing densities with reduced requirements regarding space and time for management. The blade chassis or enclosure provides a number of hardware components which are shared by the individual blade servers: power supply modules, media slots, USB connections, hot-swap blower modules, I/O modules (e.g. Fibre channel, Ethernet) management module bays, standard fabric switch module bays, four high-speed fabric switch module bays Blade chassis typically support 7, 14, 16 or more blades. Blade systems include one or more management modules for the management of the chassis as well as KVM interfaces (keyboard, video and mouse). Server blades include the CPU, RAM and interfaces to storage and network resources. The server blade connects to the shared resources, power, I/O, networking and storage through a backplane or mid-plane in the chassis. Thus adding and maintaining server hardware is facilitated compared to standard rack servers. Blades are hot swappable, allowing live upgrades. Typically the motherboard hosts either one or two CPUs. I/O blades provide specialized I/O and networking respectively switching and routing capabilities for blade systems. With the increased computing densities now made possible with blade server technology, it has become beneficial to use 10Gb Ethernet as a interconnect technology in the backbone of the data centre. Many I/O and network functions can be supported by plug-in I/O modules fitting into the I/O module slots. However fast Ethernet switch modules may require that blades have 10Gb Ethernet ports.. Typický rám (chassis) blade serveru pohled zezadu

7 Dvou- a víceuzlové servery
Dual-node and multi-node servers are partly based on a similar philosophy as blade servers. The multi-node concept combines several server units (commonly 2-4) in one rack-mounted chassis. The servers share power-supplies and fans however compared to blades they are not modular and not flexible regarding configuration. Thus multi-node serves are an approach to implement moderately higher computing density at comparably low cost. This type of hardware is often designed for purposes of small and medium enterprises. However there are also high performance dual-node concepts available for example for blade systems where two servers are combined in one server blade (Sun Blade X6275 M2). The figure shows a standard dual node server with the shared power supply, fans, CPU, I/O interfaces and a high-end dual-node blade designed for maximum performance in virtualised blade systems. Standardní dual node server (19“/1U server se dvěma uzly) Dual node blade (SUN) (Blade server se dvěma uzly)

8 Obecné koncepce úspory energie pro servery

9 Typy datových center Zdroj: Hint 2010 Typ datového centra
Počet serverů Přibližné energetické nároky Podlahová plocha Podíl na celkovém počtu datových center Serverová komora Serverovna Malé datové centrum Střední datové centrum Velké datové centrum According to US and German studies data centres can be categorized in terms of number of servers, power demand and floor area. The typical abundance of the different server types in the data centre categories is shown in the table. The table shows that server closets and server rooms up to 20m2 floor area are the major types of IT facilities making up more than 95% of the total number of facilities. Small data centres (<150m2) are already less than 5% and Medium to large data centres less than 1%. However as shown in the next slide large data centres may host thousands of servers whereas closets and server rooms host only a few

10 Střední datové centrum
Procentuální podíl typů serverů v datových centrech Zdroj: Hint 2010 Serverová komora Serverovna Malé datové centrum Střední datové centrum Velké datové centrum přibližný počet serverů Tower (věžové provedení PC) Blade servery Zařízení do IT rozvaděče Mainframe (sálové počítače) Concluding from the table rack servers represent the most common server form factor (almost 50%), followed by blade servers (approx. 18%), mainframes/UNIX (approx 17%) and tower servers (approx 15%). Tower servers are most common in server closets while rack servers are abundant in all types of data centres. Blade servers are most common in small data centres whereas mainframes mainly appear in medium to large DCs

11 Možnosti správy napájení od úrovně komponent až po úroveň systému
Úroveň komponent Úroveň systému Úroveň IT rozvaděče Úroveň datacentra Procesor C-stavy jádra/balíku P-stavy T-stavy Termoregulátor Další komponenty D-stavy L-stavy S-stavy CKE* Správa napájení založená na platformě Rozvrhy provozní zátěže Řízení rychlosti ventilátoru Management uzlu nebo systému Vyvažování aplikace/zátěže Management na úrovni Monitoring provozních celků a zařízení Úklid dat, odstraňování duplicit atd. Management skupiny rozvaděčů, dynamické konsolidace Power management technologies can be implemented at many different levels. Some power management features are embedded in and pertain to the operation of individual components. Other features operate at the server unit level, managing multiple components simultaneously. Still others operate at the rack or data centre level, managing sets of servers or even entire server populations. Power management policies are passed from each hierarchical level to the next so each level can manage itself in real time. For example a data center load-balancing power management control (data centre, multi-rack level) would not micromanage the components of each server (component level) but execute policy decisions for the server units allowing them to intelligently manage its internal components. The existence of lower-level controls is important for the higher-level policy controls to be effective. For components and systems typical performance states supporting power management are defined by the Advanced Configuration and Power Interface (ACPI). The specification provides some of the key terms that allow system designers to implement power saving features. Some machine state standards are not covered in ACPI due to new developments. Examples for the evolution of such new power management standards respectively definitions of operational states are the Active State Power Management definitions high-speed links (L-state) and the Core C-states describing core states in a multi-core CPU. The new system and component controls provide a finer grained resolution for higher-level policy engines to adjust power and performance based on actual demand. *) CKE = Clock Enable signal

12 Možnosti správy napájení od úrovně komponent až po úroveň systému
Typ stavu Používá se pro Popis G-stav systémy „Globální stavy systému“ – mohou dosahovat hodnoty od G0 (v provozu) do G3 (mechanicky vypnuto). S-stav systémy „Spací stavy systému“ – obecně dosahují hodnoty od S1 („sleeping“) až S5 (softwarově vypnuto). C-stav procesory (CPU) „Spotřeba energie procesorem a stavy termálního managementu“ při G0, tzn. při celkovém provozním stavu. D-stav zařízení „Stavy zařízení.“ Mohou se použít pro jakékoli zařízení na jakékoli sběrnici. Nabývají hodnot od D0 (zcela zapnuto) do D3 (vypnuto). P-stav procesory / zařízení „Stavy výkonu zařízení a procesoru.“ Toto jsou stavy spotřeby energie a výkonu uvnitř aktivních nebo prováděcích stavů (např. C0 a D0). CC-stav jádra CPU „C-stavy jádra“ popisují aktivitu na každém jádru. L-stav systémové vstupy/výstupy „Linkové stavy“ popisují provozní stav na vstupu/výstupu nebo sběrnici. Stavy dosahují hodnot od L0 (plný provoz) do L2 (vypnuto).

13 Spotřeba energie a účinnost procesorů AMD a Intel
Režim napájení AMD Prefix čísla procesoru Intel® Xeon® (např. _5482) Vysoký výkon (ale náročné na energii) SE X Výkon Standardní Standard Power E Mainstream Energeticky účinné HE L Výkonově optimalizovaný Vysoce energeticky účinné EE Procesor AMD Opteron 61xx [OPT11] Počet jader Taktovací kmitočet [GHz] ACP [Watty] 6132 HE 8 2.2 65 6140 2.6 80 6166 HE 12 1.8 6176 2.3 6180 SE 2.5 105 Datasheets normally contain the thermal design power (TDP), which is the maximum power the cooling system in a server is required to dissipate. Both Intel and Advanced Micro Devices (AMD) have defined TDP however Intel’s and AMD’s interpretation (especially relevant for CPU comparison based on data sheets) differ to some extent. According to Intel the upper point of the Thermal Design Power (TDP) should be used for processor thermal design targets and is not the maximum power that the processor can dissipate. According to AMDs definition the thermal design power is the maximum power a processor can draw for a thermally significant period while running commercially useful software. The constraining conditions for TDP are specified in the notes in the power tables.” Recently AMD has introduced an additional power value called ACP (Average CPU Power) defined as the average (geometric mean) power a processor dissipates while running a collection of 5 different benchmarks (Transaction Processing Performance Council (TPC Benchmark*-C), SPECcpu*2006, SPECjbb*2005, and STREAM.) Commonly server CPUs are classified according to three or four TDP classes – so called power bands. AMD and Intel are using different terminology. The tables show the categorization of CPU power bands and examples of AMD processor series

14 Výkon dle termálního designu a průměrný výkon procesorů AMD
Socket F (patice F) AMD Opteron 6100 AMD Opteron Režim napájení ACP* [Watt] TDP* [Watt] ACP [Watt] TDP [Watt] EE 40 60 - 32 35 HE 55 79 65 85 50 Standardní výkon 75 115 80 95 SE 105 137 140 ACP TDP Řada CPU 105 W 140 W 6100 (G34) 80 W 115 W 65 W 85 W 75 W 95 W 4100 (C32) 50 W 32 W 35 W Tabulky ukazují typické výkony ACP a TDP pro různé režimy napájení (Power Bands) u konkrétních procesorů AMD (vysoký výkon proti energeticky optimalizovanému výkonu). *) ACP = Average CPU Power (AMD), průměrný výkon CPU TDP = thermal design power, tepelný návrhový výkon

15 Zlepšování energetické účinnosti napříč produkty a generacemi procesorů
G5 (2,66GHz, Xeon L5430) G6 (2,40 GHz, Xeon L5530) G7 (2,26 GHz, Xeon L5640) Poměr výpočetního výkonu a příkonu Poměr výpočetního výkonu a příkonu Poměr výpočetního výkonu a příkonu celkových ssj_operací/Watt celkových ssj_operací/Watt celkových ssj_operací/Watt Cílová zátěž Cílová zátěž Cílová zátěž Recent developments regarding energy efficiency of CPUs in rack servers at different load levels can be illustrated by the example of the server family DL380 from Hewlett-Packard. HPs ProLiant DL 380 server family represents volume rack servers with riche expansion options to support virtualization, and database applications in a 2U form factor. The model family is marketed as versatile, general-purpose 1- 2 processor rack mount servers best suitable for enterprise data centres and sophisticated SMB environments deploying and database applications, front-end network applications. Data from SPECpower benchmarking (SPECpower_ssj2008 is a CPU centric power performance benchmark) is available for the server generations G5-G7. The most recent generation G7 has been benchmarked for two different CPU types based on Intel Xeon X-series (Performance) as well as L-series (Power optimized). The benchmarking profile for each of this servers is shown, including a performance chart (red columns) and the active power draw (blue line) for load points from 10% to 100 %. The power draw for active idle is plotted additionally. According to the data the ratio of Idle power to 100% load power has been reduced tremendously from G 5 to G 7 models. For the DL 380 G 5 server idle power (no load) was 33 % (170 watts) lower than 100% power (253 watts). In the case of G7 idle power is only one quarter of maximum power. Thus new server technology has become much more energy efficient at low load levels due to intelligent power management at CPU level. Běh naprázdno Běh naprázdno Běh naprázdno Průměrný činný výkon (W) Průměrný činný výkon (W) Průměrný činný výkon (W)

16 Poměr výpočetního výkonu a příkonu Poměr výpočetního výkonu a příkonu
Zlepšování energetické účinnosti napříč produkty a generacemi procesorů G7 (2,26 GHz,Xeon L5640) G7 (3,07 GHz, Intel Xeon X5675) Poměr výpočetního výkonu a příkonu Poměr výpočetního výkonu a příkonu celkových ssj_operací/Watt celkových ssj_operací/Watt Cílová zátěž Cílová zátěž The TDP for both G7 servers is declared with 95 resp. 60 watts. This difference in CPU’s power consumption can be related to the difference in peak power (at 100 % target load) of 222 vs. 172 watts. However for both server models average energy efficiency across workloads (3.197 vs overall ssj_ops/watt) is quite comparable (Xeon X5675, 3.07 GHz and Xeon L5640, 2.26 GHz) and active idle power (52,3 resp. 53,6 watts) is quite similar as well. Hence evaluating CPUs energy efficiency based on TDP is not recommended. Běh naprázdno Běh naprázdno Průměrný činný výkon (W) Průměrný činný výkon (W)

17 Technologie „Turbo Boost“ od firmy Intel
Vyšší výkon na požádání Kmitočet Intel’s “Turbo Boost Technology” temporarily increases CPU performance by increasing frequency of one or more cores. The Turbo Boost Technology was originally introduced in the Intel Core CPU family (mainly for desktop systems and notebooks) based on Nehalem processor architecture but is now available in recent XEON server processors as well. Turbo Boost is engaged by default and activated when the Operating System (OS) requests the highest processor performance state (P0). The processor may operate in Turbo Boost mode as long as it stays within its thermal (TDP and maximum temperature) limits. Frequency is increased in steps. The maximum frequency is dependent on the number of active cores. The amount of time the processor stays in boost mode depends on the workload and operating environment. Turbo Boost technology is OS independent, what means that Advanced Configuration and Power Interface-aware (ACPI) operating systems require no changes to support Turbo Boost technology. This concept can contribute to higher energy efficiency especially if maximum performance is only required occasionally and for short time periods. In this case it is not necessary to choose high performance CPUs with high energy consumption as Turbo Boost provides enough headroom for occasional load peaks.. Všechna jádra pracují na jmenovitém kmitočtu Všechna jádra pracují na vyšším kmitočtu Méně jader může pracovat na ještě vyšších kmitočtech

18 Kalkulátor výkonu pro blade Výkon při dynamickém zastropování
Koncepce pro optimalizaci kapacity napájecího zdroje – zastropování výkonu Účinek zastropování výkonu (Technologie HP „Dynamic Power Capping“) maximální požadavek na výkon založený na odhadech z výrobního štítku maximální požadavek na výkon založený na konfigurátorech maximální požadavek na výkon založený na výkonových vrcholech Active setting respectively allocation of power budgets to servers is known as power capping. IT managers can specify power caps for servers according to real requirements. Dynamic power capping allows to reduce power capacity and effective power of the system. Power capping reduces the CPU-p-state to a less power consuming level. CPU-p-states are defined processor performance states which can be different depending on processor type. The p-states correspond with a specific core frequency (e.g. 2,0/2,33/2,66GHz for different p-levels). Lower power states than the ones defined by p-states can be accessed by clock speed throttling via the BIOS. However management by p-states is normally the more efficient way respectively leads to a lower loss of performance. The processor frequency reduction is continued automatically until the peak-power is below the user defined cap. Dynamic power capping executed via a management controller is much faster and allows very short monitoring cycles compared to power capping via BIOS (several readings per second). Power capping allows to optimize power provisioning beyond the level typically supported by online power configurators (provided by manufacturers). The use of online power configurators already allows a much better estimation of required cooling and power capacity compared to using nameplate rated power data. However dynamic power caps allow to further optimize sizing of power supply and cooling capacity thereby offering additional energy and cost savings. The figure provides a schematic illustration of power usage over time when using power capping alternatively respectively in addition to power demand calculation or simple consideration of nameplate power. It is important to emphasise that power capping does not improve the energy efficiency of single server units (e.g. in terms of operations per watt) but helps to optimize power allocation between servers and to increase overall efficiency of power usage by eliminating power peaks demanding high power capacity. čas Snížení maximálního požadavku na příkon při zastropování výkonu (případová studie HP) Kalkulátor výkonu pro blade Výkon při dynamickém zastropování Příkon chassis (16 bladů) 6000 W 4790 W Náklady na poskytování výkonu 100% 80%

19 Požadavky Energy Star na účinnost napájecích zdrojů pro servery
Typ napájecího zdroje Nominální výstupní výkon Při zátěži 10% Při zátěži 20% Při zátěži 50% 100% S více výstupy (AC-DC a DC-DC) Všechny výstupní úrovně - * 82% 85% S jedním výstupem (AC-DC a DC-DC) ≤ 500 Wattů 70% 89% > 500 – Wattů 75% > Wattů 80% 88% 92% Efficiency of power supplies being stepchild for long time has been strongly improved in the last years. The Energy Star program for servers has set requirements for power supply efficiency defining efficiency levels for 10%, 20%, half load and full load for multi-output and single-output power supplies. For the latter the requirements are specified for different levels of rated power. *) nedefinováno

20 Požadavky Energy Star na účiník napájecích zdrojů pro servery
Typ napájecího zdroje Nominální výstupní výkon Při zátěži 10% Při zátěži 20% Při zátěži 50% 100% S více výstupy (AC-DC a DC-DC) Všechny výstupní úrovně -* S jedním výstupem (AC-DC a DC-DC) ≤ 500 Wattů 0,80 0,90 0,95 > 500 – Wattů 0,65 > Wattů *) nedefinováno

21 Požadavky programu 80plus na energetickou účinnost a účiník
% nominální zátěže 20% 50% 100% 80 PLUS Bronze 81% 85% 80 PLUS Silver 89% 80 PLUS Gold 88% 92% 80 PLUS Platinum 90% 94% 91% Účiník (PF) 80 PLUS Bronze 0,9 (100% zátěž) 80 PLUS Silver 0,9 (50% zátěž) 80 PLUS Gold 80 PLUS Platinum 0,99 (100% zátěž) The 80 Plus Certification Scheme for power supplies also provides efficiency requirements however excluding the 10% load level. 80PLUS Gold and Silver requirements are more demanding than Energy Star levels. The higher efficiency categories of 80PLUS are more demanding than the Energy Star requirements.

22 Typický provozní bod napájecích zdrojů podle studie Energy Star
Typický provozní bod napájecího zdroje (neredundantního) cílové nastavení (střední výkon při střední konfiguraci) Cílové nastavení napájecího zdroje (aktuální zátěž/nominální zátěž) Many standard rack servers operated at relatively low load levels are equipped with redundant power supplies of far too high rated power. It is evident that such configurations cause high energy losses due to an unfavourable operating point of the power supply. Energy Star has published detailed data on idle power, maximum power and rated power both for minimum and maximum configurations of various server families. Averaging idle and maximum power for the lowest and highest configuration possible provide a proxy for a realistic power consumption. Relating this proxy for on-average power to the rated power for a configuration with only one power supply provides rather disappointing results. The vast majority of servers is operated with highly over provisioned power supplies. Given the fact that many servers are equipped with redundant power supplies the realistic power supply’ load indicated in teh figure above even has to be divided by the factor of two. Manufacturers like HP (e.g. in their ProLiant G6 and G7 server series) provide a special power supply operation mode to overcome this problem. This ROM-based setup provides the user with a ”High Efficiency” mode and a ”Balanced” mode”. In Balanced mode both power supplies provide power equally while in the “High Efficiency mode” the system only uses one power supply until the system load exceeds a certain threshold. The second power supply stays online maintaining redundancy. Both modes provide full power redundancy in case of a power supply or circuit failure. Rodiny serverů, které vyhovují specifikacím Energy Star

23 Použití hardwarových komponent při různých typech provozní zátěže
CPU Paměť Pevné disky Vstupy / výstupy Souborový / tiskový server o + ++ Mail server Virtualizační server +++ Web server Databázový server Aplikační server Terminálový server Appropriate configuration of severs is a key issue for achieving adequate performance at optimum energy efficiency. To low hardware configuration may cause performance problems while over provisioned systems will cause unnecessary high power consumption. Thus defining performance requirements based on the type and intensity of workloads is crucial. The table provides a rough indication on hardware component performance requirements of different types of applications. Another aspect relevant for adequate hardware configuration is expandability. Excessive expandability often is also a source of inefficiency. Many servers allow extensive upgrading of storage, memory or CPUs that however is not commonly used in practice. Hardware allowing extensive but unused upgrading is less efficient and should be avoided.

24 Správa napájení pomocí výkonnostních profilů
Charakter úsporného opatření/prvku Maximální výkon Vyvážená spotřeba a výpočetní výkon Minimální spotřeba energie Regulátor výkonu Statický vysoký Dynamický Statický nízký Správa výkonu QPI* Vypnuto Zapnuto Paměť s prokládanými cykly Plné prokládání Zakázáno Rozhraní PCIe 2.0 ** Povoleno Rychlost paměti Automatická 800 MHz Minimální výkon procesoru při běhu naprázdno Žádné C-stavy C6 The concept of power profiles at server level can be explained by the example of a feature currently available for HP ProLiant 300-series G6 and G7. The HP Power Profile defines three possible configurations for power features providing a simple mechanism for users to configure power management options based on tolerance to power versus performance. There are three possible settings for this profile concept: Maximum Performance; Balanced Power and Performance Minimum Power Usage. The power management addresses CPU, memory and interfaces. The pre-sets for the three categories are listed in the table. *) Intel QuickPath Interconnect **) PCIe, Peripheral Component Interconnect Express

25 Úsporné režimy na úrovni operačního systému (příklad Windows Server 2008)
Watty (% z maxima) Výkon (% z maximálního příkonu) Power management on OS level can be illustrated based on the example of Windows Server This OS version provides settings for power saving strategies in different power management modes: “Balanced mode” – optimizes out of the box power efficiency “High performance mode” appropriate for servers running at very high utilisation and need to provide maximum performance, regardless of power costs “Power saver mode” can be used for servers operated at low loads having more performance capability than really needed. Enabling of the power save mode in Windows 2008 leads to high savings of more than 15% especially in medium load situations (see Figures and Figures) Provozní zátěž (% z maximální propustnosti) Provozní zátěž (% z maximální provozní zátěže)

26 Vyhodnocení možností konsolidace za pomoci podpůrného softwaru (např
Vyhodnocení možností konsolidace za pomoci podpůrného softwaru (např. Capacity Advisor) Využití CPU pro puny03v8 Počet jader Profily různých provozních zátěží analyzovaných pro konsolidaci Čas Využití CPU pro puny03v7 In the following a practical example for evaluation of CPU utilization for different servers is provided. Accomplishing workload analysis in Capacity Advisor CPU or memory utilization over time can be viewed. The Figure shows a graph of CPU utilization for a single system over a one-month period. The peak value is marked with (1). A comparison of the two graphs shows that workload peaks on the two systems do not occur simultaneously and do not require the same percentage of the allocated CPU cores. This suggests an opportunity to consolidate both systems. Originally a total of 4 cores are used (2 per system) From the graph it is evident that the peak of the combined workloads is less than the capacity of 2 CPU cores. Even with utilization limits in place this system is unlikely that 4 CPU cores are required to meet the workload demand. Počet jader Čas

27 Vyhodnocení možností konsolidace za pomoci podpůrného softwaru (např
Vyhodnocení možností konsolidace za pomoci podpůrného softwaru (např. Capacity Advisor) Využití CPU pro puny03v7 Profil kombinovaných provozních zátěží Počet jader Obrázek ukazuje kombinovanou zátěž na jednom systému, respektive výsledek programu Capacity Advisor pro scénář „what-if“. (tj. „Co se stane, když sloučíme provozní zátěž na jeden systém?“) Čas

28 Vlastnosti nástrojů pro plánování kapacit, příklad: HP Capacity Advisor
Sběr údajů o jádrech CPU, paměti, síti, diskových vstupně-výstupních rozhraních a využívání výkonu. Zobrazení historického využívání zdrojů celým operačním systémem a sledovanými zátěžemi na systémech HP-UX a OpenVMS a využívání zdrojů všemi pracovními zátěžemi na systémech Microsoft Windows a Linux. Zobrazení historických provozních zátěží a agregovaného vytížení napříč souvislým mnohadiskovým prostorem (partitioning continuum). Generování zpráv o vytížení prostředků/zdrojů. Plánování provozní zátěže nebo změn systému, vyhodnocení jejich vlivu na vytížení prostředků/zdrojů. Vyhodnocení vlivu využívání prostředku/zdroje na navržené změny týkající se místa nebo velikosti provozní zátěže. Vyhodnocení trendů pro předpověď potřebných prostředků/zdrojů. The HP Insight Capacity Advisor allows monitoring and evaluation of system and workload utilization including CPU cores, memory, network and disk I/O, and power. This information supports data center operators in increasing energy efficiency by optimizing workload levels on available hardware resources. One or more systems that are connected in a cluster configuration or to a network can be evaluated and monitored. The Capacity Advisor helps to evaluate system consolidations, load balancing, changing system attributes and thus supports decisions how to arrange workloads to improve utilization. The analysis provided can support the planner in estimating future system workloads and in planning system configurations. All the features can also be used to evaluate options to increase energy efficiency. Among others the indicated tasks can be performed. Capacity Advisor can use data collected over time to show the results of configuration changes. Effects of the changes over time and percentage degree of system use is shown. allowing a comparison of resource utilization and quality of service before and after a change. Overall the use of capacity planners provide a strong advantage for system design and planning compared to largely unsupported decisions. The tools provide a quantitative basis for examining the usage of current resources and the capability to do simulations (what-if scenarios) for moving workloads or resources before changes are implemented.

29 Vlastnosti nástrojů pro správu napájení, příklad: Active Energy Manager IBM
Monitoring a logování údajů o spotřebě energie Správa napájení včetně Nastavení voleb pro úsporu energie Nastavení zastropování výkonu Automatizace úloh souvisejících s napájením Konfigurace měřicích zařízení, např. napájecích lišt (PDU) a senzorů Prohlížení událostí Výpočet nákladů na energii a odhadovaných úspor energie Nastavení prahových hodnot Vytvoření a nastavení politik pro správu napájení Monitoring napájecích a chladicích zařízení souvisejících s IT This tool is a plug-in to IBM Systems Director [IBMAEM] designed for monitoring and management of power and cooling of IBM rack and blade server systems. IBM states that non-IBM systems can also be monitored using adequate metering products, such as power distribution units (PDU), sensors and integration with facility software. Tasks which can be accomplished using Active Energy Manager resources include: see Figure The configuration of metering devices (PDUs and sensor devices, to associate them with other resources) and cooling devices allows to view all resources cooled by a cooling device and all cooling devices which cool a resource. The feature facilitates supportive measures for cooled resources. Power cap value for IBM servers and IBM BladeCenter systems can be set ensuring that system power consumption stays at or below the value defined by the setting. A system power policy can be defined (which is a power cap or power savings setting applicable for IBM Power systems and zEnterprise systems) for any number of individual systems or groups of systems. A group power capping policy specifies an overall power cap that the systems in the group collectively may not exceed. It can be applied to any number of groups. No additional settings are defined on the target resources and groups of resources. An event automation plan can be used to define power event criteria (filters) to trigger power-related event actions.

30 Možnosti energetických úspor u blade serverů a víceuzlových serverů

31 Výhody blade systémů a víceuzlové technologie
Hlavní výhody blade systémů jsou: Vysoká výpočetní hustota a nízké požadavky na prostor; Zkrácená doba na údržbu a rozšíření systému díky výměně modulů za provozu (hot-plug) a integrovaným funkcím pro správu a management; O něco vyšší energetická účinnost v porovnání s rozvaděčovými servery, je-li optimalizována správa napájení a chlazení. Hlavní výhody víceuzlových (multi-node) serverů jsou: Nižší cena a prostorové nároky ve srovnání se standardními rozvaděčovými servery; Mírně nižší spotřeba elektrické energie díky sdíleným napájecím zdrojům a ventilátorům.

32 Účinnost napájecího zdroje Zátěž (% nominálního výstupního výkonu)
Energetická účinnost blade serverů Napájecí zdroje Účinnost napájecího zdroje Účinnost (%) Larger power supplies are often more efficient respectively can be designed for higher efficiency. Thus strategies to reduce the number of power supplies in IT systems respectively a consolidation to fewer larger power supplies as for example used in blade systems allow to increase energy efficiency. The figure shows a platinum labelled power supply of 2990 kW rated power for a blade chassis. As a procurement criterion for power supplies in blade chassis a 90% level between 20 and 100% load can be recommended. For new product generations of blade and multi-node servers some manufacturers provide so called common slot power supplies for different levels of rated power. Such power supplies allow right-sizing according to the power demand of a server. Such rightsizing is supported by online hardware configurators and power calculators offered by manufacturers as well as by power capping analysis. Účinnost (%) Zátěž (% nominálního výstupního výkonu) Účinnost „platinové kategorie“ napájecích zdrojů pro blade chassis (podle 80plus 2011)

33 Efficiency of platin level power supply for blade chassis
Energetická účinnost blade serverů ve srovnání s IT rozvaděčovými servery Poměr výpočetního výkonu a příkonu Poměr výpočetního výkonu a příkonu celkových ssj_operací/Watt celkových ssj_operací/Watt Cílová zátěž Cílová zátěž For a rough comparison of the energy efficiency of blade and standard rack servers the case of a fully configured blade system compared with the same number of standard rack servers may be considered. Such a rough comparison may be done based on some energy efficiency data published by Dell. Dell has published SpecPower-data (SPECpower_ssj2008) for a blade system and comparable rack servers in SPECpower_ssj2008 is an energy efficiency benchmark for servers focussing on some hardware components like for example CPU-efficiency. It is therefore not a tool designed for holistic energy efficiency rating of servers. It is used here for a very rough comparison for the given purpose however explicitly stating that the results shall not be over interpreted. The SPECpower-values have been published for the Dell PowerEdge 610 servers both for the rack version (1U, R610) and the blade version (16 Blades, M610, PowerEdge M1000E enclosure). Both server types use the same CPUs with identical clock speed (Xeon 5670) and the same chip configuration (2 chips with 6 cores per server, 12 cores in total). The SPEC results shown in the figure indicate a maximum performance of 3885 ops/watt at 100% load for the blade system and 3739 ops/watt for the 1U rack system. This indicates that the performance per watt or the energy efficiency at maximum load is 4% better in the blade solution compared to the rack solution. The difference increases to about 8% for low loads (10%load) and to 11% for idle operation. Similar results had been indicated earlier for a blade system and a comparable rack server from HP in 2009, however were not officially published. Although due to the reasons given above the results must not be over interpreted they give rise to the conclusion that blade systems, even if fully configured and optimised for testing, show only slightly better energy efficiency compared to standard rack servers especially at high loads. The difference seems to increase at low load levels indicating a better overall power management in the blade system. Běh naprázdno Běh naprázdno Průměrný činný výkon (W) Průměrný činný výkon (W) Efficiency of platin level power supply for blade chassis SPECpower_ssj2008 pro blade server Dell M610 a rozvaděčový 1U server R610: (2 x Intel Xeon 5670, 2,93GHz), podle SPEC - červenec/srpen 2010

34 Efficiency of platin level power supply for blade chassis
Definice maximální výkonové kapacity založené na zastropování výkonu Příklad dimenzování výkonu při zastropování výkonu (HP) Kalkulátor výkonu pro blade Výkon při dynamickém zastropování Příkon chassis (16 bladů) 6000 W 4790 W Náklady na poskytování výkonu 100% 80% Nastavení výkonového stropu pomocí „Insight control (HP)“ Jméno systému Minimální výkon Průměrný výkon Maximální výkon Max. dostupný výkon Spodní mez výkonového stropu Hodnota vrcholu In blade chassis dynamic power capping can be used even more efficiently than for standard rack servers since the dynamic power cap can be specified across multiple servers within the chassis. Power caps will be dynamically adjusted by the onboard administrator and the service processor. Blades running lighter workloads will receive lower caps compared to blades with higher workload. Since workload intensity and dynamics will be different for the different blades power peaks will occur at different times and consequently the overall cap for the chassis can be set lower compared to the sum of individual caps for single blades. HP-blade chassis for example monitor, test and record power data including maximum, minimum and average actual power. They check the power supply specifications and execute the power capping settings. Peak power data is provided for each server during the power on self test. An onboard administrator actively manages the power caps based on a multi-tiered algorithm. HP has calculated power savings and reduced TCO for a blade centre where power supply design was based on power calculators compared to the situation when power capping was applied. The results are summarised in the table Maximum power and power provisioning cost was reduced by about 20% in the solution with power capping applied. Efficiency of platin level power supply for blade chassis

35 Koncepce pro optimalizaci výkonové kapacity napájecího zdroje
Krok 1 Zaveďte pracovní skupinu, která bude společně s provozními specialisty (facility group) zodpovídat za napájení a chlazení Zkontrolujte správu napájení respektive možnosti zastropování výkonu na vašem hardwaru Proveďte první optimalizaci požadavků na kapacitu napájení a chlazení založenou na kalkulátorech výkonu poskytovaných výrobci Vyhodnoťte skutečný energetický požadavek za pomoci dostupných nástrojů pro management energie během celých provozních cyklů a nastavte stropy výkonu podle špiček zátěže Nastavte výkon napájení a chlazení podle vyladěného systému, který pracuje s definovaným stropem výkonu Zaveďte příslušná opatření pro projekty napájení a chlazení. Pokračujte v monitoringu využívání energie a jemném vylaďování systému. Krok 2 Krok 3 Krok 4 Krok 5 Typical steps for application of power management and power capping for IT hardware and infrastructure development and provisioning. Power capping in blade systems provide higher savings if workloads running on the various blades are different. In this case also power peaks are different and overall caps may be set significantly lower compared to individual blade server caps. In contrast to that for high performance computing respectively in cases where synchronised identical workloads are run in parallel savings may be relatively low. Krok 6

36 Jak na blade systémy s vysokou hustotou
Výzvy a problémy Pro vysoké výkonové hustoty je nutné mít nejen dostatečný chladicí výkon, ale i odpovídající (konstrukčně vhodný) systém chlazení Dostatečná distribuce napájení (kapacita distribučních elektrorozvaděčů, PDU, kabelážních systémů atd.) Analýzou se musí zjistit Dostupný elektrický výkon – lokální dostupná výkonová kapacita, možnosti distribučních tras (dimenzování silových kabelů), výkony UPS Dostupný chladicí výkon a distribuce chladu – celkový chladicí výkon a použitelnost distribučních tras pro větší lokální tepelné zátěže. Požadavky na chlazení předmětných blade systémů

37 Návrh blade systémů a jejich chlazení na úrovni datového centra
Počet blade chassis v IT rozvaděči Rozptýlení zátěže mezi rozvaděči Vyhrazená chladicí kapacita Přídavné chlazení Zóna s vysokou výkonovou hustotou Datové centrum s vysokou výkonovou hustotou 1 Možné ve většině DC Nákladově neefektivní 2 Zřídkakdy praktické 3 Nelze Možné ve většině DC, závisí na konkrétním řešení Maximum pro energeticky optimalizované systémy se zvýšenou podlahou 4 Závisí na konkrétním řešení Systémy odsávající horký vzduch Odsávání horkého vzduchu, nový návrh místnosti 5 6 Extrémní náklady Different chassis density levels allow the following options for cooling of blade systems: Spreading the heat load of blade chassis to different racks: Individual blade chassis are mounted to different racks to spread heat load. For this concept the percentage of blade chassis in the total system has to be very low Dedicating cooling capacity: Excess cooling capacity is specifically dedicated to the blades. Also for this approach the percentage of blades in the system has to be relatively low as the existing cooling capacity is used to supply the blades. Installing supplemental cooling: Supplemental cooling is provided for the blade racks. Power density per rack can be up to 10kW. The approach allows good floor space utilization and high efficiency. Definition/design of high density area: Specific area in the data centre is dedicated to blades (high density row or zone). High efficiency and high floor space utilization. Density up to 25kW. Area has to be planned and redesigned Design of high density centre: High density blade racks throughout the data centre. Extreme rather uncommon approach that for most situations lead to very high costs and underutilization of infrastructure

38 Obecné výhody virtualizace serverů
Konsolidace a soudržnost: Nárůst využití serverů od 5-15% do 60-80%. Optimalizace testování a vývoje: Rychlé poskytování (provisioningú testovacích a vývojových serverů za pomoci opětovného využívání před-konfigurovaných systémů, pozvednutí spolupráce vývojářů Kontinuita podnikání: Snížení složitosti a nákladů spojených s nepřetržitým podnikáním (řešení pro vysokou dostupnost a obnovu po havárii) za pomoci zapouzdření celých systémů do jednotlivých souborů, které lze replikovat a obnovit na jakémkoli cílovém serveru. Korporátní pracovní plocha (Enterprise Desktop): Zabezpečení nespravovaných počítačů, pracovních stanic a laptopů bez oslabení autonomie koncových uživatelů rozvrstvením bezpečnostní politiky v softwaru kolem desktop virtuálních strojů Server virtualization offers large potentials for energy savings. Server consolidation by virtualization reduces power consumption by strongly reducing the number and increasing the utilization of physical servers. Established virtualization platforms like VMWare, Microsoft HyperV and Citrix XEN offer many additional features like high availability, failover, distributed resource scheduling, load balancing, automated backup functions, distributed power management, server-, storage- and network vmotion etc..

39 Virtualizace serverů

40 Produkty pro virtualizaci - přehled trhu
VMWare ESX/ESXi, Vsphere představen na trhu v roce 2001 podpora pro nejběžnější hostovské operační systémy výkonné nástroje pro správu Microsoft HyperV malý půdorys lze jej vložit do existujících IT prostředí Citrix XENServer cenově efektivní způsob pro zavedení virtualizace The market leading virtualization platforms VMWare ESX/ESXi/Vsphere4, Microsoft HyperV and Citrix XEN provide effective opportunities for saving energy and administration costs. They offer support for most common standard guest operating systems like Windows Server 2003/2008, Windows XP, Vista, Windows7 and SUSE/Redhat Linux and provide powerful management consoles for administration of smaller server environments as well as data center level administration.

41 Úspory energie při virtualizaci serverů Příklad 1: Virtualizace serverů + desktopů
Spotřeba energie (kWh/rok) Staré servery + Úložiště dat 21314 Staré desktopy (stolní PC) 29523 Staré řešení celkem 50837 Nové servery + Úložiště dat 16934 Tenké poskytování (klienti) 2790 Nové řešení celkem 19724 Virtualization is one of the most powerful technologies for reducing energy demand in data centres. Consolidation of server hardware concentrating workload on a lower number of physical servers allows energy savings between 40 and 80% and sometimes even more depending on the specific case. Current technology allows to implement virtualization with consolidation factors of at least depending on the specific systems and requirements. Here another virtualization example from SUN involving both server consolidation and desktop virtualisation. The case has been conducted in a small municipality in Germany is shown. The energy savings achieved were about 60%. Obrázek: Virtualizace serverů a desktopů (SUN 2009)

42 Elektrický příkon [Watty]
Úspory energie při virtualizaci serverů Příklad 2: Virtualizace serverů Elektrický příkon [Watty] Virtualization is one of the most powerful technologies for reducing energy demand in data centres. Consolidation of server hardware concentrating workload on a lower number of physical servers allows energy savings between 40 and 80% and sometimes even more depending on the specific case. Current technology allows to implement virtualization with consolidation factors of at least depending on the specific systems and requirements. Here another virtualization example from SUN involving both server consolidation and desktop virtualisation. The case has been conducted in a small municipality in Germany is shown. The energy savings achieved were about 60%. Dřívější stav Nový stav Virtualizace serverů německého Ministerstva životního prostředí

43 SW nástroje pro plánování virtualizace a výpočet ROI/TCO (MAP-Toolkit)*
Vlastnosti Detekce klientů, serverů a aplikací napříč IT prostředím. Vyhodnocování (významu) migrace a virtualizace v IT projektech. Samočinné generování technických zpráv (reportů) a návrhů. Škálování řešení pro malé společnosti i velké korporátní subjekty. Výpočty úspory energie a návrh na virtualizaci. Technická zpráva o migraci serveru a návrh: Windows Server a reporting o „hostovskými servery virtualizovaných instancích OS“ („virtualized guests by hosts”) Návrhy na migraci a reporty virtualizační aplikace od Microsoftu: Doporučení pro aplikaci virtualizace používající App-V. The Assessment and Planning (MAP) Toolkit from Microsoft supports planning for migration to energy efficient computing technologies. The MAP-Toolkit is a inventory, assessment, and reporting tool that can assess IT environments for various platform migrations and virtualization without the use of software agents. MAP’s automated inventory and readiness assessment reports generate specific upgrade recommendations for migration to power-saving Windows Vista and Windows Server 2008 operating systems and also for virtualization. It provides recommendations how physical servers can be consolidated in a Microsoft Hyper-V virtualized environment. Comment by the translator: A virtual machine (VM), typically has two components : the host and the guest. The host is the virtual machine host server; the underlying hardware that provides computing resources, such as processing power, memory, disk and network I/O, and so on. The guest is a completely separate and independent instance of an operating system and application software. Guests are the virtual workloads that reside on a host virtual machine and share in that server's computing resources. Application virtualization is an umbrella term that describes software technologies that improve portability, manageability and compatibility of applications by encapsulating them from the underlying operating system on which they are executed. A fully virtualized application is not installed in the traditional sense[1], although it is still executed as if it were. The application is fooled at runtime into believing that it is directly interfacing with the original operating system and all the resources managed by it, when in reality it is not. In this context, the term "virtualization" refers to the artifact being encapsulated (application), which is quite different to its meaning in hardware virtualization, where it refers to the artifact being abstracted (physical hardware). *) MAP-Toolkit = Microsoft Assessment and Planning Toolkit ROI = Return On Investment (návratnost investic) TCO = Total Cost of Ownership (celkové náklady na vlastnictví)

44 Microsoft ROI/TCO kalkulátor
Integrovaný nástroj od Microsoftu určený pro výpočet návratnosti investice při virtualizaci (Microsoft Integrated Virtualization ROI Tool), zobrazený vlevo, byl nezávisle vyvinut u přední vývojářské firmy Alinean, Inc., zabývající se nástroji pro výpočet ROI, a to bývalými TCO/ROI experty společnosti Gartner. In addition the Microsoft Integrated Virtualization ROI Tool supports the calculation of potential power cost savings with Hyper-V prior to deployment. The Microsoft Integrated Virtualization ROI Tool shown in Figure was developed independently by ex-Gartner TCO/ROI experts at leading ROI tool developer Alinean, Inc. The tool supports IT managers in examining current production servers, development servers, desktop and application virtualization opportunities by quantifying the potential savings, service level benefits, investments and ROI for Microsoft Virtualization solutions. The tool collects specific information about current costs and opportunities for improvement and projects potential costs and benefits for various optimization strategies using the Microsoft Virtualization solutions. Alinean and Microsoft experts conducted market research to assess typical costs and savings for similar company type and size.

45 Výpočet TCO/ROI kalkulátorem od VMWare
Aby se určily úspory nákladů a změřila obchodní hodnota řešení VMWare, byla metodika pro TCO/ROI použitá ve VMWare stvrzena bývalými ROI/TCO experty společnosti Gartner při konzultaci s Alinean Inc. The TCO/ROI methodology used by VMWare was validated with ex-Gartner ROI/TCO experts at consultancy AlineanInc. to quantify the cost savings and business value of VMware solutions. The methodology is based on proven financial techniques, industry research, VMware field and customer data and user metrics to quantify and compare the TCO savings, required investments and business benefits of implementing VMware virtualization solutions. The methodology is applied in the VMware TCO / ROI Calculator, an on-line tool designed to support organizations in collecting key information about their opportunities for improvement and to quantify the benefits that can be achieved with virtualization solutions. Based on user-specific data the key figures like savings, investments, ROI, NPV savings, TCO opportunities and payback period are calculated. Where specific user data is not available, statistical data from industry is provided and may be used. The TCO /ROI methodology first helps organizations to quantify the current cost of ownership for IT and infrastructure before virtualization.

46 Výpočet TCO/ROI kalkulátorem od VMWare
The TCO analysis compares the virtualization scenario with the business as usual scenario to achieve the change in TCO The ROI analysis compares the net benefits with the incremental investment as a percentage to illustrate the ratio of returns versus investment (ROI = net benefits / investment). The payback period analysis determines the duration till net benefits of the proposed solution exceed the cumulative investment in the project. In summary virtualization projects have a clear return on investment (ROI) as server consolidation reduces hardware as well as power and cooling costs and advanced features cut down on management overhead. However ROI calculations are still an essential element for successful virtualization projects. The best ROI calculations take all costs (hardware, software and several hidden costs) into account and fully quantify the benefits of server virtualization projects. With accurate information about virtualization ROI and total cost of ownership (TCO) the implementation of virtualization projects can be strongly facilitated. Calculations also help to discover potential problems in the project planning. The methodology used in the tools is based on proven financial techniques, industry research and customer data and metrics. TCO savings, required investments and business benefits of virtualization solutions are analysed. Analýza TCO porovnává virtualizační scénář se obvyklým vývojem bez virtualizace a z rozdílu vypočítá změnu v nákladech na vlastnictví (TCO). Analýza ROI porovnává čisté zisky s narůstající investicí jako procentuální podíl, aby ilustrovala poměr výnosů k investici (ROI = čisté výnosy / investice). Metodika použitá v nástrojích se zakládá na osvědčených finančních postupech, průzkumu oboru, zákaznických datech a metrikách.

47 Správa napájení pomocí nástroje DPM migrace serveru od VMWare
VMWare Vsphere4 Distributed Power Management (DPM) in a DRS cluster can be used to reduce the power consumption of ESX hosts. DPM monitors the resource use of the running virtual machines in the cluster. If there is significant excess capacity DPM recommends to move some virtual machines between hosts and to put some hosts into standby mode to conserve power. In case of insufficient capacity DPM will recommend power on standby hosts again to fully powered active state. Power management can be configured to operate in either manual or automatic mode. In manual mode the user must confirm host power state recommendations for migration. In automatic mode vCenter Server migrates virtual machines and moves hosts into or out of standby mode automatically. Distribuovaná správa napájení VMWare Vsphere4 (Distributed Power Management , DPM) v clusteru DRS lze použít pro snížení spotřeby energie ESX hostů. U běžících virtuálních strojů v clusteru DPM sleduje využívání zdroje. Pokud dojde k významnému nadbytku výkonu, DPM doporučuje přesunutí některých virtuálních strojů mezi hosty a přepnutí některých hostů do pohotovostního stavu (standby), aby se šetřila energie. …. V automatickém režimu vCenter Server migruje virtuální stroje a přesouvá hosty do nebo z pohotovostního režimu (standby) automaticky.

48 Správa napájení s DPM migrací Vlastnosti migračního nástroje DPM
Přesné vyhodnocení požadavků provozní zátěže na zdroje. Nadhodnocení může vést k nižším než ideálním úsporám energie Z podhodnocení může vyplývat slabý výpočetní výkon a porušení smluvních podmínek (SLA) o úrovni zdroje DRS. Vyvarování se častého zapínání a vypínání serverů. Příliš častým zapínáním a vypínáním serverů se zhoršuje výpočetní výkon, protože toto vyžaduje nadbytečné operace VMotion. Rychlá reakce na náhlý nárůst požadavků provozní zátěže tak, aby při spoření energie nebyl obětován výpočetní výkon. Výběr vhodných hostů pro zapínání nebo vypínání. Vypínání většího hosta s mnoha virtuálními stroji by mohlo narušit cílový rozsah vytíženosti jednoho nebo více menších hostů. Inteligentní přerozdělení (redistribuce) virtuálních strojů po zapnutí a vypnutí hostů plynulou (hladkou) pákou DRS. The goal of VMware DPM is to keep the utilization of ESX hosts in the cluster within a target range, subject to the constraints specified by the VMware DPM operating parameters and those associated with HA and DRS. VMware DPM evaluates recommendation for host power on if there are hosts with utilization levels above this range and host power off if there are hosts with utilization levels below. Although this approach might seem straightforward, there are key challenges that VMware DPM must overcome to be an effective power saving solution. VMware DPM is run as part of the periodic DRS invocation (every five minutes by default), immediately after the core DRS cluster analysis and rebalancing step is complete. DPM = Distributed Power Management, distribuovaná správa napájení DRS = Distributed Resource Scheduler, distribuovaný plánovač zdrojů

49 Různé možnosti použití nástroje DPM od VMWare
Nastavení VMware DPM do automatického režimu a ponechání na VMware DPM algoritmu, aby diktoval, kdy se hosty zapínají a vypínají. Vyladění VMware DPM za pomoci posunutí prahu DPM v nastavení clusteru nebo v pokročilém nastavení cílového poměru požadavek - výkonnost (Demand-Capacity-Ratio Target) tak, aby byl konzervativnější nebo agresivnější. Zvýšení cílového poměru požadavek-výkonnost (Demand-Capacity-Ratio Target). Pro uspoření více energie zvýšením vytížení hosta (konsolidací více virtuálních strojů na méně hostů) je možné zvýšit hodnotu poměru požadavek-výkonnost z výchozích 63% na například 70%. Použití VMware DPM k nucenému zapnutí všech hostů před pracovní dobou a následné výběrové vypínání hostů po odeznění špičkového intervalu provozní zátěže. The basic way to use VMware DPM is to power on and shut down ESX hosts based on utilization patterns during a typical workday or workweek. For example, services such as , fax, intranet, and database queries are used more intensively during typical business hours from 9 a.m. to 5 p.m. At other times utilization levels can dip considerably, leaving most of the hosts underutilized. Their main work during these off hours might be performing backup, archiving, servicing overseas requests etc.. In this case consolidating virtual machines and shutting down unneeded hosts during off hours reduces power consumption.

50 Požadavky na napájení a chlazení po virtualizaci
Škálování infrastruktury podle zátěže Dostupný výkon Napájení / Chlazení Dostupný výkon Napájení / Chlazení DOWNGRADE – ale s očekávaným opětovným růstem Dynamic power variation in virtualized environments is a major reason for moving towards row or rack cooling. Virtualization can reduce cooling load in a data centre to very low levels which can cause negative effects on the cooling equipment (e.g. compressor load). Thus right sized power and cooling is another crucial element for successfully exploiting energy saving potentials by virtualisation. Accurate information about demand for power and cooling capacities is crucial to ensure that infrastructure capacity can be adapted to changing load profiles over time. Capacity management provides instrumentation for real time monitoring and analysis of information about power-, cooling- and physical space capacities and enables the effective and efficient use of resources throughout the data center. Areas of available or very low capacity can be identified. Původní zátěž Škálování dolů, počáteční konsolidace Škálování nahoru, opětovný růst Virtualizovaná zátěž Původní zátěž Virtualizovaná zátěž Aby se zajistila možnost přizpůsobit výkon podpůrné infrastruktury podle zátěžových profilů, které se během doby mění, je zcela nezbytné mít přesnou informaci o potřebách zátěže na výkon systému napájení a chlazení.

51 Měnící se požadavky na chlazení při migraci serverů
PŘED virtualizací PO virtualizaci Konstantní zátěže Stabilní chlazení Migrující zátěže s vysokou hustotou výkonu Nepředvídatelné chlazení Virtualization can cause increased rack power density and dynamic change of local density, thus locally increasing the demands on power and cooling infrastructure while overall reducing power demand. The basic power and cooling requirements of virtualization are similar to those already introduced by high density blade systems in the past. There are technologies available now to meet the power and cooling needs of a virtualized environment. If power and cooling capacity is not adapted to the lower load levels, PUE will worsen after virtualization, which reflects the additional overhead of idle power and cooling capacity. While virtualization reduces overall power consumption in a data centre, servers are often grouped in ways that create local “hot spots”. Virtualization also allows applications to be dynamically moved, started and stopped causing changing loads over time and space. In a conventional environment involving traditional raised-floor, room based cooling can be configured to adequately cool hot spots by rearranging vented floor tiles. With dynamic loading of servers, the thermal profile can change with no physical changes in the equipment. Řešením tohoto problému je umístit chladicí jednotky uvnitř řad a technicky je vybavit, aby cítily tepelné změny a reagovaly na ně. Umístění chladicích jednotek blízko k serverům také poskytuje kratší trasy pro dopravu vzduchu mezi chlazením a zátěží.

52 Vlastnosti managementu napájení a chlazení
Změna hustoty a místa zátěže – Virtualizace může vytvořit hotspoty bez přidání nebo přesouvání fyzických serverů, protože systém distribuované správy napájení průběžně vypíná servery a zapíná jiné. Dynamické změny – Udržování stability systému se může stát obtížné, zvláště pokud více stran provádí změny bez centralizované koordinace Zvládání vzájemných závislostí – Virtualizace více zkomplexňuje sdílené závislosti a vedlejší druhotné jevy ve vztazích mezi napájením, chlazením a prostorovou kapacitou Neúčinné (jalové) poskytování napájení a chlazení – Během virtualizace jde zátěž potřebující napájení a chlazení dolů a pak opět narůstá s vytvářením nových virtuálních strojů. Toto lze zvládnout při použití škálovatelných napájecích a chladicích systémů. Capacity management provides instrumentation for real time monitoring and analysis of information about power-, cooling- and physical space capacities and enables the effective and efficient use of resources throughout the data center. Areas of available or very low capacity can be identified.

53 Přizpůsobení infrastruktury napájení a chlazení po virtualizaci
Škálování kapacity napájení a chlazení tak, aby odpovídala zátěži Ventilátory s variabilní rychlostí a invertorem řízená čerpadla, která jsou řízena podle požadavku chlazení Používání zařízení s vyšší účinností Architektura chlazení mající kratší trasy pro dopravu vzduchu, např. řadové chladicí jednotky (in-row) Systém pro správu kapacit by měl přizpůsobit výkonovou kapacitu systému k požadavku Používání záslepek pro snížení míchání chladného a horkého vzduchu uvnitř IT rozvaděče After virtualization power consumption will always be less because of reduced server population and reduction in power consumed by the cooling systems. Data center infrastructure efficiency however will be low if power and cooling systems are not downsized and adapted to align with the new smaller IT load. In summary when carrying out virtualization projects, power and cooling capacity have to be adapted to the lower load levels. Otherwise PUE will increase reflecting additional overhead for power and cooling capacity. While virtualization reduces overall power consumption in a data center it may cause changing loads over time and space. With dynamic loading of servers the thermal profile can change without physical changes in the equipment. In a conventional environment with traditional raised-floor room based cooling can be configured to adequately cool hot spots by rearranging vented floor tiles.

54 Doporučení nejlepší praxe

55 Doporučení nejlepší praxe Nákup a konfigurace hardwaru
Promyslete skutečné výkonové požadavky vašich provozních zátěží a vyvarujte se nadměrného poskytování (over-provisioningu) výpočetního výkonu. Stanovte kritéria pro nákup založená na skutečných praktických požadavcích. Pečlivě si zvažte očekávanou potřebu upgradů komponent a přizpůsobte specifikaci reálným požadavkům Rozsáhlé možnosti upgradů často nejsou v praxi potřeba. Vezměte v úvahu kritéria energetické účinnosti serverů, které jsou stanoveny v požadavcích Energy Star. Vyvarujte se nadměrného poskytování napájecích zdrojů Silný over-provisioning je naneštěstí docela běžný.

56 Doporučení nejlepší praxe Nákup a konfigurace hardwaru
Zvažte použití napájecích zdrojů s vysokou účinností, např. ze skupiny Platinum nebo Gold podle klasifikace programu 80PLUS. Zlepšete energetickou účinnost redundantních napájecích zdrojů použitím energeticky úsporných režimů provozu (volby energeticky úsporného pohotovostního režimu pro redundantní procesory). Od výrobců vyžadujte výsledky hodnocení výkonnosti (benchmarks), například SPECpower_ssj2008 (SPEC-SERT jakmile bude k dispozici). Pro SPECpower_ssj2008 zvažte následující: servery se často testují s nízkou konfigurací zvažte účinnost při různých úrovních zátěže, které jsou typické pro vaše provozní zátěže a úroveň konsolidace SPECpower_ssj2008 je orientovaný spíše na procesor a nemusí poskytnout dostatečnou informaci o paměti, disku a vstupně-výstupních sběrnicích při intenzivních provozních zátěžích

57 Doporučení nejlepší praxe Plánování a správa IT
Mějte užitek z optimalizovaných úrovní pružnosti IT hardwaru. Vyhodnoťte úroveň odolnosti hardwaru z pohledu odůvodněného vlivu servisních incidentů na vaše podnikání a to pro každou rozvinutou službu. Použijte nástroje pro management serverů pro energeticky účinné rozvíjení služeb a plánování kapacit, zaměřte se na vytvoření vysoce konsolidovaných a virtualizovaných systémů. Jako výchozí nastavení povolte možnosti správy napájení na úrovni procesoru (CPU). Vyřaďte z provozu nepoužívané služby a odstraňte hardware. Vyhodnoťte možnost vyřadit z provozu služby s nízkou hodnotou pro vaše podnikání.

58 Doporučení nejlepší praxe Nasazení blade serverů
Definujte a vyhodnoťte hlavní důvody pro zavedení blade technologie v datovém centru, například prostorové omezení apod Rozhodnutí managementu o zavedení blade technologie by mělo být založeno především na jasných rozhodovacích kritériích. Vyhodnoťte očekávané výhody ve srovnání s rozvaděčovou technologií (serverů) a zkontrolujte, zda vaše očekávání jsou reálná. Při zvážení definovaných cílů zkontrolujte, jestli by alternativním řešením mohla být virtualizace. Vyhodnoťte očekávané celkové náklady na vlastnictví (TCO) a energetickou účinnost v porovnání s dalšími možnostmi (na základě informací poskytnutých dodavateli).

59 Doporučení nejlepší praxe Plánování a vyhodnocení blade serverů
Definujte provozní zátěže a očekávané úrovně zátěže, které by měly běžet na blade systémech. Porovnejte náklady a energetickou účinnost blade systémů od různých dodavatelů. Vyžádejte si informace o produktech od dodavatelů: TCO celková energetická účinnost (např. SPECpower2008jpp, SPEC-SERT jakmile bude k dispozici) energeticky úsporné hardwarové komponenty, například účinnost a dimenzování napájecích zdrojů nástroje pro management zvláště také zaměřené na správu napájení a optimalizaci návrhu systému vyberte si zařízení nabízející nejvyšší účinnost pro takové typy zátěží, které budete provozovat, a zvolte si odpovídající možnosti správy napájení

60 Doporučení nejlepší praxe Management blade systémů
Použijte nástroje pro management blade serverů k optimalizaci jejich energetické účinnosti Pro váš blade systém použijte nástroje pro management, inteligentní síť a napájecí zařízení k monitoringu spotřeby energie a zátěže Analyzujte možnosti vyvážení zátěží a řiďte zátěže a spotřebu energie uvnitř jednotlivých blade chassis a napříč celými IT rozvaděči Používejte zastropování výkonu a vlastnosti vyvažování zátěže v rámci blade chassis

61 Doporučení nejlepší praxe Infrastruktura pro blade systémy
Se specialisty odpovídajícími za chlazení a infrastrukturu vytvořte společný takticko-úkolový tým. Zkontrolujte jak dalece stávající infrastruktura napájení a chlazení podporuje používání blade technologie. Určete očekávané a požadované hustoty napájení a výkonu na IT rozvaděč a celkem. Zkontrolujte zda hustota výkonu/tepla může být zvládnuta se stávající výkonovou kapacitou systému napájení a chlazení a existující infrastrukturou. Je možné s rozumným úsilím přidělovat (alokovat) existující volnou kapacitu? zda je potřeba přídavné chlazení. Stanovte jeho vhodnou koncepci a vyhodnoťte náklady a účinnost. zda pro blade systémy musí být ustanovena a navržena zvláštní zóna s vysokou výkonovou hustotou. Vyhodnoťte náklady a účinnost. Se specialisty na infrastrukturu datových center definujte vhodnou koncepci uspořádání IT rozvaděčů a řad.

62 Doporučení nejlepší praxe Hlediska pro virtualizaci
Vývoj virtualizační strategie Určení kandidátů na virtualizaci požadavky na výkon procesoru, požadovaná paměť, intenzita diskových vstupně-výstupních operací, požadavky na síť, konfigurace operačního systému Výběr typu virtualizace a nástroje (produktu) pro virtualizaci Přizpůsobení IT procesů a pracovních schémat rozmístění a nasazení virtuálních strojů, virtuálních pracovních ploch (desktopů), procesů pro zálohování a obnovu dat, správy patchování, úvah ohledně dostupnosti

63 Doporučení nejlepší praxe Hlediska pro virtualizaci
Výběr softwaru včetně analýzy výhod a nevýhod různých produktů: Rozhraní pro správu a administraci Licenční poplatky za hypervizora, licenční poplatky za běžící instanci operačního systému (guest OS) atd. Vlastnosti a možnosti managementu včetně nástrojů pro migraci serverů a správu napájení Úvahy o vhodných infrastrukturních opatřeních Chladicí systém musí umět zvládnout: Vyšší hustoty chladicího výkonu Dynamicky se měnící hustoty v důsledku migrace serverů a vypínání Sdílené vzájemné závislosti a sekundární jevy

64 Doporučení nejlepší praxe Uvážení ROI/TCO pro virtualizaci
Úspěšně optimalizované plánování a implementace virtualizačních řešení zahrnuje vyhodnocení TCO a ROI, v potaz se berou následující aspekty: Nástroje pro výpočet ROI jsou k dispozici od dodavatelů technologií Kalkulace by měly začínat největšími a nejvýznamnějšími faktory Modely by měly být upřesňovány podle potřeb konkrétní společnosti Úvahy o ceně by měly zahrnovat cenu práce, náklady na upgrade hardwaru (servery, datová úložiště, síť, infrastruktura) a náklady za případnou dobu výpadku systému a dále také různé typy snížení těchto nákladů (např. zálohování/obnova dat, dostupnost atd.)

65 Diskuze Otázky související s modulem

66 Otázky / diskuze související s modulem
Kolik energie (%) v průměru představuje energetická spotřeba serverů? Jaké jsou hlavní výhody z virtualizace serverů? Jaké jsou potenciální úspory energie spojené s virtualizací? Uveďte prosím jeden ze šesti postupů pro optimalizaci výkonové kapacity napájecího zdroje. Jaké jsou podle vás hlavní překážky při zlepšování energetické účinnosti v serverech?

67 Další návrhy na čtení Bílé knihy Publikace on-line atd.

68 Další návrhy na čtení Pět způsobů pro snížení spotřeby energie v datovém centru Použitím virtualizace ke zlepšení účinnosti datového centra Správné dimenzování výkonu systému napájení a systému chlazení pro IT zátěže

69 Další návrhy na čtení Analýza výsledků průzkumu nepoužívaných serverů
Cestovní mapa pro akceptaci vlastností zaměřených na správu napájení v serverech Analýza podnětů získaných z pomůcky pro virtualizaci serverů


Stáhnout ppt "Modul 3 Servery Verze 1.0 21. září 2011."

Podobné prezentace


Reklamy Google