IBM ma nową wizję - stworzyć oparty o architekturę Blue Gene superkomputer, który będzie w stanie obsłużyć cały Internet. Co ciekawe, w mediach często pojawia się wzmianka, jakoby założyciel IBM-a, Thomas Watson, stwierdził w latach 40-tych, że na światowym rynku znajdzie się zapotrzebowanie na maksymalnie pięć komputerów. Chociaż nie ma żadnych dowodów, że to rzeczywiście słowa Watsona, może się za moment okazać, że utworzony przez niego koncern zasieje ziarno prawdy w tych prasowych pomówieniach.
IBM rozpoczął prace nad przedsięwzięciem, którego cel aż trudno sobie wyobrazić. Projekt Kittyhawk, bo taką nadano mu nazwę kodową, przewiduje stworzenie superkomputera, którego moc obliczeniowa pozwoli na obsługę całego Internetu jako aplikacji sieciowej. Udostępniona przez IBM dokumentacja wywołała niemałe zamieszanie w środowiskach powiązanych z rozwojem technologii internetowych.
Szafa Blue Gene/P zawierająca 1024 węzły (4096 procesorów) i 2 TB pamięci operacyjnej.
Widoczny na zdjęciu superkomputer Blue Gene/P charakteryzuje się optymalnym wykorzystaniem przestrzeni, niewielkim poborem mocy i możliwością szybkiej rozbudowy. IBM planuje wykorzystać tę technologię, by wybić się na zdominowanym przez klastry rynku usług hostingowych.
Chociaż większą część dokumentacji zajmują opisy rozwiązań programistycznych zrozumiałych wyłącznie dla wtajemniczonych, jeden szczegół natychmiast rzuca sie w oczy. W planowanym serwerze ma się znaleźć 67,1 miliona rdzeni i 32 petabajty (miliony gigabajtów) pamięci operacyjnej.
Nowe dziecko IBM-a ma powstać w oparciu o architekturę Blue Gene/P, w której miliony wykorzystywanych procesorów tworzą zhierarchizowaną strukturę. Na jej najniższy poziom składają się cztery rdzenie PowerPC 850 MHz wbudowane na jeden chip wraz z kontrolerami pamięci. Kolejny poziom to karta, na której znajdują się 32 takie czterordzeniowe węzły (nodes). Szesnaście kart tworzy tzw. midplane. Każda szafa serwerowa mieści dwa midplane’y, czyli 1024 węzły albo 4096 procesorów, które mają do dyspozycji 2 TB pamięci. Architektura Blue Gene/P pozwala połączyć w sieć 16384 takie szafy, co daje w końcowym podliczeniu owe szokujące 67,1 miliona rdzeni. Jako że każda szafa potrafi przetworzyć 640 Gb/s, ukończony system miałby do dyspozycji przepustowość 10,4 petabita na sekundę.
Co więcej, projekt IBM-a wykorzystuje wyłącznie sprawdzone technologie. Maszyny oparte na architekturze Blue Gene zajmują obecnie 4 miejsca na liście 10 najpotężniejszych superkomputerów świata, w tym pierwsze – okupowane przez IBM-owski Blue Gene/L. Architektura Blue Gene/L jest następczynią starszej P. Można się spodziewać, że chociaż projekt Kittyhawk początkowo zakładał wykorzystanie Blue Gene/P, to jeśli planowany superkomputer kiedyś powstanie, to raczej na bazie wydajniejszej architektury L.
Zdaniem przedstawicieli IBM-a, serwery korzystające z zalet przetwarzania symetrycznego (jak Blue Gene) mają wiele zalet, dzięki którym nadają się do hostingu usług internetowych lepiej niż zwyczajne klastry. Głównie chodzi tu o oszczędność miejsca i energii elektrycznej. Z drugiej strony, klastry są dużo przyjaźniejsze dla kieszeni klientów i o wiele prostsze w rozbudowie. Dzieje się tak dlatego, że w dużej mierze składają się z powszechnie dostępnych na rynku podzespołów. To właśnie ta elastyczność w doborze mocy obliczeniowej do potrzeb spowodowała, że firmy takie jak Sun Microsystems, Amazon.com, Google i Microsoft zdecydowały się pobudować swoje serwery internetowe w oparciu o klastry.
Przedstawiciele IBM-a nie odmawiają klastrom zalet, ale jednocześnie zapewniają, że dzięki swojej niezawodności i skalowalności, rozwiązania oparte na architekturze Blue Gene lepiej nadają się do obsługi oprogramowania sieciowego. Ich zdaniem, klienci mogą liczyć na duże oszczędności ze względu na wydajność infrastruktury.
IBM zwraca również uwagę, że szybko rozwijające się firmy internetowe często nie nadążają ze zwiększaniem przepustowości, ponieważ właściciele serwera, z którego korzystają, muszą się borykać z niezwykle czasochłonnym procesem rozbudowy klastra. W architekturze Blue Gene podłączanie kolejnych szaf nie zakłóca pracy reszty systemu, co pozwala na szybką rozbudowę w razie nagłej potrzeby. Co więcej, klastry znane są z częstych awarii, które prowadzą do przerw w dostawie usług i wymuszają posiadanie zastępczej infrastuktury. Serwery oparte na Blue Gene nie psują się natomiast prawie wcale.
Jeśli chodzi o funkcjonalność, to obecna generacja Blue Gene idzie łeb w łeb z klastrami. Technologia IBM obsługuje większość typowego oprogramowania internetowego, jak Linux, Apache, MySQL i Ruby on Rails. IBM opiera swoją ocenę systemu na wynikach dwóch benchmarków wydajnościowych: SPECjbb2005, w którym Blue Gene osiągnął wynik 9565 BOPS (operacji biznesowych na sekundę) oraz LAMP (Linux Apache MySQL Perl/Python), w którym architektura IBM-a również zasłużyła na świadectwo z paskiem. Badacze z obozu IBM-a są zdania, że skoro Blue Gene już teraz radzi sobie tak dobrze, to zoptymalizowana wersja zmiecie klastry z powierzchni ziemi. W opublikowanej przez IBM dokumentacji badacze pozwolili sobie wysunąć hipotezę, że platforma Blue Gene/P o klasę przewyższa stosowane obecnie klastry pod względem kosztów zakupu i użytkowania.
Obecna generacja pozwala osiągnąć wysoką wydajność dzięki wykorzystaniu linuksowego mikrojądra, zdalnego systemu zarządzania, zestawu specjalistycznych programów i technologii pracy bezdyskowej. W arsenale Blue Gene znajdują się też zoptymalizowane procedury przetwarzania równoległego zaimplementowane zarówno na poziomie oprogramowania, jak i serwera, zaawansowany system kontroli błędów oraz wbudowane narzędzia administracyjne.
Jeśli chcieć wytknąć technologii IBM-a jakieś wady, to na pierwszy ogień powinno pójść wykorzystanie architektury PowerPC. Stawiając na produkowane przez siebie procesory, IBM zmusza programistów piszących dla Blue Gene do korzystania z nielubianego Linuksa dla PowerPC albo niewygodnego przenoszenia kodu z Linuksa x86, co nieodmiennie kończy się spadkiem wydajności. Mimo iż IBM-owi udało się stworzyć rewolucyjną technologię, to nadal trudno mu się pogodzić z faktem, iż przegrał wojnę o dominację na rynku procesorów.
Podsumowując, nawet jeśli IBM nie zrealizuje projektu Kittyhawk, to po dopracowaniu swojej atrakcyjnej architektury na pewno znajdzie niejednego klienta wśród gigantów hostingu internetowego.
Komentarze
0Nie dodano jeszcze komentarzy. Bądź pierwszy!