Z pamiętnika inżyniera Data Center – „Gorączka serwerowni, czyli dlaczego klimatyzacja to największy przyjaciel serwerów?”

Epizod 2

Zdarzyło się to kiedyś na jednym z renomowanych ośrodków edukacyjnych, gdzie przeprowadziliśmy gruntowną modernizację serwerowni. Z technologicznego punktu widzenia było to dzieło sztuki – najnowsze serwery, redundantne zasilanie, połączenia światłowodowe o przepustowości, która mogłaby obsłużyć streamowanie w 8K w każdym biurze. Do tego klimatyzacja. Bo wiecie, serwerownia bez klimatyzacji to jak komputer gamingowy bez wentylatora – długo nie pociągnie.

I właśnie klimatyzacja, ten niepozorny element, który większość ludzi ignoruje, okazała się bohaterką (a raczej antybohaterką) tej historii. Ale o tym za chwilę.

Kiedy wszystko działa idealnie

Na początku wszystko szło zgodnie z planem. Serwerownia działała jak marzenie – temperatury utrzymywały się w stabilnym przedziale 18-20°C. Klimatyzatory chłodziły, serwery przetwarzały dane z prędkością, o której przeciętny komputer może tylko marzyć. A dlaczego temperatura jest taka ważna? Otóż, w serwerowni każdy stopień powyżej optymalnych 20°C to potencjalny krok w stronę technologicznej apokalipsy.

Serwery, mimo że są niezwykle wydajne, generują ogromne ilości ciepła. Każdy procesor, dysk, karta sieciowa – wszystko to grzeje się niemiłosiernie. Bez odpowiedniego chłodzenia, temperatura w serwerowni może w ciągu kilkunastu minut osiągnąć poziom, na którym nawet jajka na miękko się ugotują. A serwery, w odróżnieniu od jajek, naprawdę nie lubią ciepła. Kiedy temperatura rośnie, zaczyna się throttling – procesory zmniejszają swoją moc obliczeniową, żeby się nie przegrzać. Działa to jak instynkt samozachowawczy – lepiej pracować wolniej niż się spalić.

I tu dochodzimy do sedna sprawy. Serwery, które mieliśmy na uczelni, były sprzętem z najwyższej półki. Każdy miał potężny procesor, ogromną ilość pamięci RAM i dyski SSD, które przetwarzały dane jak szalone. Ale każdy z nich miał też jeden kluczowy wymóg: chłód. I tu wkracza klimatyzacja – ta cicha bohaterka, której zadaniem było utrzymanie serwerów w komfortowej temperaturze, żeby mogły działać pełną parą.

Nagły alarm – co poszło nie tak?

Wszystko działało świetnie, aż pewnego dnia… dostajemy telefon. „Serwerownia przestała działać, kolejne systemy po sobie idą w offline!”. No i zaczyna się śledztwo. Z miejsca uruchamiam w głowie wszystkie możliwe scenariusze: awaria zasilania? Zasoby zjadły jakieś nieoptymalne procesy? Może nawet atak hakerski? Każdy inżynier IT wie, że serwery nie padają bez powodu.

Przyjeżdżamy na miejsce. Otwieram drzwi serwerowni, a tam… poczułem się, jakbym wszedł do sauny. Termometr na ścianie pokazywał 40°C, a wentylatory w serwerach wyły, jakby próbowały odlecieć w kosmos. Pierwsza myśl: „Co, do licha, stało się z klimatyzacją?”.

Okazało się, że ktoś – i tu zaczyna się najlepsze – wyłączył klimatyzatory. Dlaczego? Bo na piętrze nad serwerownią odbywał się bardzo ważna konferencja międzynarodowa, a hałas klimatyzacji „przeszkadzał” prelegentom i uczestnikom. No cóż, ktoś postanowił, że lepiej na chwilę wyłączyć chłodzenie, żeby było cicho. A że serwery w tym czasie zaczęły się topić? Cóż, to już szczegół.

Dlaczego to jest takie złe?

Technologicznie rzecz biorąc, wyłączenie klimatyzacji w serwerowni to jak wyciągnięcie wtyczki z wentylatora, gdy grasz na komputerze w grę wymagającą wszystkich zasobów. Serwery się gotują. Każdy stopień powyżej 30°C to zwiększone ryzyko throttlingu, a powyżej 40°C zaczyna się festiwal awarii. Przegrzewający się procesor potrafi się wyłączyć, a w ekstremalnych przypadkach nawet uszkodzić. Dyski twarde zaczynają działać niestabilnie, pamięć RAM przestaje nadążać, a cała infrastruktura, która miała być niezawodna, postanawia iść na urlop.

W tym przypadku serwery zaczęły się wyłączać jeden po drugim. Procesory, żeby się nie przegrzać, postanowiły zredukować swoją moc, co spowodowało, że serwerowe farmy przestały przetwarzać dane, a my mieliśmy na rękach technologiczny Armagedon. W sumie, zamiast eleganckiej serwerowni, mieliśmy saunę dla serwerów.

Wnioski? Nigdy, przenigdy nie wyłączaj klimatyzacji w serwerowni!

Cała ta sytuacja to dowód na to, jak kruche są nowoczesne systemy IT, jeśli wyłączymy tak „nieistotny” element jak klimatyzacja. Serwery mogą obsługiwać miliony operacji na sekundę, przetwarzać gigantyczne ilości danych, ale bez odpowiedniego chłodzenia są bezbronne jak lód na pustyni.

Pamiętajcie – nie ważne, jak głośna jest klimatyzacja – jej dźwięk to melodia bezpieczeństwa.