• datacentrum
  • bezpečnost

Jak funguje UPS a jak se vyhnout výpadku elektrické energie

author.label Damir Špoljarič
aneb v našem datacentru mají servery zajištěnou nepřetržitou dodávku elektřiny.

Včera se potýkalo jedno pražské datové centrum několikahodinovým výpadkem napájení elektrické energie. Dle vyjádření provozovatele šlo o chybu UPS, kdy se nečekaně vybily baterie při instalaci nového diesel generátoru. S podobným problémem se potýkala i další hostingová firma s datacentry v Praze a Brně. Podívejme se, jak vlastně systém UPS funguje, proč jde o nejdůležitější komponentu celého datacentra a jak má být ve správném datovém centru UPS udržována a co od ní lze očekávat.

UPS slouží k zajištění nepřetržité dodávky elektrické energie pro koncové spotřebiče (v případě datacentra jde především o servery a kritické části infrastruktury datacentra) a také k zajištění kvalitní dodávky, kdy UPS vyrovnává podpětí či předpětí na síti.

Nejpoužívanějším typem pro tento účel jsou bateriové UPS (on-line UPS s invertorem), zřídkakdy lze najít v některých datacentrech rotační UPS, která funguje na principu velkého setrvačníku, který dodává až několik desítek vteřin napájení serverům do doby nastartování generátorů. Bateriový systém je používanější, neboť jeho účinnost je v dnešní době poměrně vysoká (> 96%) a zaručuje dodávku energie po dobu několika jednotek až desítek minut, čímž se získá větší časová rezerva například ke startu záložního generátoru. O UPS je však nutné patřičně pečovat a znát slabá místa tohoto systému.

Životnost baterií, aneb jak se nespoléhat na dobu zálohování

Výrobce v dnešní době deklarují životnost baterií až 12 let. Lze to přirovnat ke garanci spotřeby auta výrobcem. Jde o velice teoretický údaj závislý na mnoha faktorech, mezi které patří například prostředí, ve kterém se baterie nacházejí či jejich četnost a způsob vybíjení a nabíjení. Baterie potřebují prostředí 20°C, vyšší teplota prostředí zkracuje dobu životnost, nižší teplota zvyšuje dobu životnosti, ale zkracuje dobu zálohování.

Baterie postupem času ztrácí svoji původní kapacitu a výpočet doby zálohování vychází z matematického výpočtu UPS dle typu baterií a vybíjecí křivky (při vybíjení baterii klesá napětí a při stálém odběru tedy stoupá proud (P=U x I) – to znamená, že se rychlost vybíjení zrychluje). UPS tak může krásně na display psát předpokládanou dobu zálohování 30 minut, ale po pár letech to již nemusí být pravda a posledních pár desítek % baterie při vybíjení zmizí v mžiku. 

Z tohoto důvodu je nutné provádět pravidelné kapacitní zkoušky, které například v ServerParku provádíme jednou do roka. Při těch se provádí vybíjení baterií až na nízkou hodnotu, sleduje se vybíjecí křivka a také rozdíl napětí na bateriích, čímž se zjistí i například vadný článek baterie, což je opět situace, kterou UPS nemá možnost v běžném provozu poznat.

Paralelní bateriové stringy UPS

Kapacitní test je přitom naprosto bezpečný, protože pouze sníží úroveň napětí ze sítě na usměrňovači na vstupu UPS ze sítě, čímž se začnou baterie vybíjet. Pokud by při testu došlo k problému, například nečekaně rychlému vybití baterií (pod kritickou hodnotu, která je po dobu testu nastavena na usměrňovači), nezpůsobí to výpadek napájení serverů, protože při náhlém poklesu napětí na bateriích UPS začne ihned napájet ze sítě.

Baterie jsou ve stringu zapojeny v sérii a pokud by došlo někde například k vadné baterii a výrazným zvýšením jejího vnitřního odporu nebo špatnému kontaktu mezi dvěma bateriemi, při výpadku napájení ze sítě dojde k tomu, že UPS nebude zálohovat a dojde k výpadku serverů. Z tohoto důvodu je vhodné mít zapojených několik paralelních bateriových stringů. V ServerParku tak máme na každé větvi UPS 3 nezávislé bateriové stringy. 

Nelze spoléhat na jeden systém… vždyť jde jen o techniku

Nikdy se nelze spoléhat na to, že UPS bude na 100 % fungovat, ať už výrobci deklarují co chtějí. Stejně tak správné datové centrum nemůže provádět výměnu či servis generátoru bez jiného náhradního zdroje elektrické energie. I dle UPTIME INSTITUTE je generátor primárním zdrojem elektrické energie.

ServerParku tak máme zapojené dvě naprosto nezávislé napájecí větve, na každé větvi je UPS v režimu N+1, tzn celkem tedy režim 2 x (N+1), každá větev disponuje vlastním diesel generátorem a současně je zapojen další diesel generátor, který je automatickým řídícím systémem připnut místo generátoru na jedné z větví, který je v poruše či údržbě. Každá větev disponuje vlastní sadou baterií a každá sada baterií je složena ze 3 stringů. 

I kdyby datové centrum potkala porucha generátoru, do toho se záhadně vybily baterie a do toho nastala porucha rozvaděče, datové centrum si s tím musí být schopni poradit bez výpadku napájení serverů. Servery by tak měly mít instalované 2 zdroje a být současně zapojeny do obou nezávislých větví, na nezávislé UPS, nezávislé rozvaděče a nezávislé generátory. Pokud servery mají pouze 1 napájecí zdroj, máme v ServerParku pro takové servery nainstalované v racku STS switche, tedy polovodičové rychlé „přepínače“, které při kompletní poruše na jedné větvi přepnou napájení z druhé větve bez výpadku serverů.

Foto z nedávné revize UPS ServerParku, která zahrnovala i kontrolu jednotlivých modulů modulární UPS (kontrola kondenzátorů, čištění modulu):