3 listopada o godzinie 6 rano dla firmy Intel rozpoczyna się nowa era procesorów. Mamy do czynienia z najszybszym obecnie dostępnym CPU, jaki można zainstalować w komputerze biurkowym - Core i7 znane
Opis architektury procesora przygotował Marcin Bieńkowski
Nową architekturę zastosowaną w Nehalemie Intel nazywa czwartą odsłona architektury Core. Głównym jej założeniem jest wprowadzenie do budowy procesorów modułowości, co sprawia, że cała konstrukcja układu jest bardzo elastyczna. Dostępne w układzie niezależne moduły wykonawcze podzielone zostały na dwie grupy. Pierwsza z nich, tzw. grupa core, obejmującej rdzenie procesorów i niezbędne jednostki zasilające oraz zegar. W drugiej grupie uncore znalazły się pozostałe elementy procesora. Co ważne obydwu częściach układu można elastycznie, w zależności od rynkowych potrzeb dodawać lub odejmować elementy funkcjonalne układu, dzięki czemu będzie można dostosować produkowane układy do aktualnych wymagań klientów, nawet jeśli wcześniej procesory niebyły w danej konfiguracji produkowane.
Podział Nehalema na moduły core i uncore
Pierwsze procesory Intel Core i7 będą układami czterordzeniowymi. Niemniej bez najmniejszego problemu przez Intela mogą być również produkowane procesory jedno-, dwu-, trzy-, cztero-, sześcio- jak i ośmiordzeniowe. Prawdopodobnie jedno- i dwurdzeniowe Nehalemy trafią na rynek jako przeznaczone do maszyn typu entry level Celerony, zaś układy sześcio- i ośmiordzeniowe będą to kości serwerowe. Trzeba jednak zaznaczyć, że nie jest w tej chwili pewne czy Intel zdecyduje się ostatecznie na produkcję układów jedno- i trzyrdzeniowych. Istotne jest jednak to, że wszystkie typy procesorów, niezależnie od liczby rdzeni, będą produkowane na jednym kawałku krzemowego wafla.
Modułowa budowa nowych procesorów ma pozwolić również na elastyczne integrowanie w strukturze procesorów wielopoziomowych pamięci cache. W zależności od potrzeb, wielkość pamięci cache trzeciego może być w zmniejszana lub zwiększana. Mało tego w procesorach serwerowych i przeznaczonych do wydajnych stacji roboczych przewidziano istnienie pamięci cache L4. Oczywiście, zarówno pamięć cache L3, jak i L4 pojawiają się w procesorach Nehalem w ramach modułu uncore.
Najważniejszą nowością wprowadzoną do procesorów Intel Core i7 w ramach segmentu uncore jest wbudowanie w układ kontrolera pamięci RAM. Kontroler taki w ramach modułowej architektury może w zależności od potrzeb zostać rozbudowany lub w niektórych wersjach procesorów usunięty. Zintegrowanym z procesorem kontrolerem pamięci dotychczas dysponowały jedynie procesory firmy AMD. Kontroler taki zmniejsza czas dostępu do danych przede wszystkim dzięki wyeliminowaniu pośrednictwa chipsetu płyty głównej. Przyspieszenie transmisji danych ma szczególne znaczenie zwłaszcza w wypadku maszyn wieloprocesorowych czyli np. zaawansowanych stacji roboczych i serwerów. Wówczas poszczególne procesory nie blokują sobie nawzajem dostępu do magistrali systemowej.
Podobnie w wypadku kontrolera RAM, część modeli Nehalemów może mieć większą, a z kolei inne mniejszą liczbę linii Quick Path Interconnect zastępujących magistralę FSB. W dostępnych dokumentach Intela znaleźć też można informacje na temat możliwości wbudowania w procesory Nehalem modułu karty graficznej.
Krzemowa struktura czterordzeniowego Nehalema
Szczegóły budowy
Z podanych przez Intela informacji wynika, że najbardziej zaawansowany ośmiordzeniowy Nehalem składa się z 731 milionów tranzystorów. Każdy rdzeń może jednocześnie przetwarzać dwa wątki, co daje sumaryczną mozliwość obsłużenia 16 różnych wątków na pojedynczym ośmiordzeniowym układzie. Wynika z tego, że Intel wrócił do stosowania technologii współbieżnej wielowątkowości Hyper-Threading znanej z układów Pentium 4. Oczywiście, obie technologie nie są pod względem szczegółowych rozwiązań takie same. Wynika to z innej wewnętrznej mikroarchitektury. Jak udało nam się dowiedzieć w Nehelemie mamy do czynienia z trzecią generacją technologii Hyper-Threading. Układy Intel Core i7 mają też w stosunku do Penrynów rozszerzoną liczbę rozkazów SSE, która nosi nazwę SSE 4.2.
Jak już wspomniałem, jedną z najważniejszych zmian w architekturze Nehalema jest zintegrowanie w jego strukturze kontrolera pamięci RAM. W procesorach Intel Core i7 znajdzie się kontroler obsługujący w sposób trzykanałowy pamięci DDR3 800, 1066 i 1333 MHz. Już w tej chwili na rynku dostępne są specjalne konfekcjonowane zestawy zawierające po trzy moduły RAM DDR3. Oczywiście, w chwili gdy włożymy tylko jeden lub dwa moduły w złącza pamięci na płycie głównej wówczas moduły RAM będą obsługiwane odpowiednio w sposób jedno lub dwukanałowy.
Z wiadomości przekazanych przez Intela najistotniejszą informacją jest to, że nie przewidziano procesorów Intel Core i7 obsługujących pamięci DDR2. Oczywiście, dzięki modułowej architekturze procesora taka teoretyczna możliwość istnieje, niemniej producent nie zamierza z niej skorzystać. Użytkownicy modyfikujący swoje komputery będą zatem musieli oprócz płyty głównej i procesora zakupić również nową pamięć.
Procesory Intel Core i7 korzystać będą wyłącznie z modułów pamięci DDR3
Wróćmy teraz na chwilę Istotną nowością wprowadzoną do architektury Nehalema jest użycie nowego, specjalnego łącza międzyprocesorowego, które wykorzystywane jest także do komunikacji z chipsetem płyty głownej. Łącze QPI (Quick-Path Interconnect), bo o nim mowa, pozwala na bardzo szybką, bezpośrednią komunikację między procesorami i elementami płyty głównej. Prędkość transmisji dochodzi do 25,6 GB/s przy zastosowaniu standardowych czterech linii QPI o przepływności 6,4 GB/s każda. Jak twierdzi producent, dzięki QPI uzyskano ponad dwukrotny wzrost wydajności w międzyukładowej transmisji danych w stosunku do wieloprocesorowych systemów komputerowych korzystających z tradycyjnej magistrali FSB.
W Nehalemie magistrala FSB zastąpiona została nową magistra QPI
Zmiany mikroarchitektury
Przejdźmy teraz do zmian w wewnętrznej mikroarchitekturze procesorów Core i7. Samo jądro jest dość zbliżone do jądra Penryn, niemniej zostało one zoptymalizowane, tak aby przyspieszyć szybkość wykonywania poszczególnych rozkazów. Według danych producenta Nehalem potrafi szybciej o ok. 33% wykonywać wewnętrzne mikrooperacje.
Niemniej najistotniejsze modyfikacje dotknęły 512 KB pamięć cache L2. Pamięć ta charakteryzuje się krótkimi czasami opóźnień. Co ciekawe, komórki pamięci cache L2 składają się z ośmiu, a nie jak do tej pory z sześciu tranzystorów. Nowa ośmiotranzystorowa pamięć cache wymaga bowiem niższych napięć zasilających.
W pamięci cache L2 pojawiły się nowe mechanizmy odpowiadające za przewidywanie dalszej części programu i pobieranie z wyprzedzeniem potrzebnych danych do pamięci cache L2. Są to moduł przewidywania rozgałęzień oraz 512 wejściowy bufor TLB (Translation Lookaside Buffer), w którym przechowywane są fragmenty tablicy stron pamięci operacyjnej komputera. Na nowo zaprojektowano również mechanizmy dostępu do pamięci cache.
Kolejną nowością jaką znajdziemy w architekturze Nehalema jest przeprojektowany bufor BTB (Branh Target Buffer) drugiego poziomu. Odpowiada on za sprowadzanie danych do pamięci cache. Nowy jest także bufor RSB (Return Stack Buffer). Ma on na celu zapobiegać błędnemu przewidywaniu pojawiających się w trakcie wykonywania programu instrukcji powrotnych.
Pamięć cache L1 procesora Nehalem nie różni się od pamięci L1 Penryna. Ma ona również pojemność 64 KB – po 32 KB dla instrukcji i danych. Ostatnim poziomem pamięci cache jest współdzielona przez wszystkie rdzenie pamięć podręczna trzeciego poziomu L3. W wypadku procesora czterordzeniowego ma ona 8 MB pojemności. Dzięki zastosowaniu pamięci cache L3 zmniejszona zostaje liczba bezpośrednich odwołań procesora do pamięci głównej RAM, co przekłada się na zwiększenie wydajności obliczeń i zmniejszenie zużycia energii.
Główne zmiany w mikroarchitekturze procesorów Intel Core i7
Nehalem z wbudowaną grafiką
Wróćmy teraz na chwilę do układów Intel Core i7 z w wbudowanym modułem graficzny. Co prawda takie procesory mają się pojawić na rynku dopiero pod koniec 2009 roku lub na początku 2010 roku, ale taki procesor może być ważny dla wielu użytkowników chcących korzystać z tanich biurowo-internetowych komputerów.
Wykorzystana w Nehalemie karta graficzna ma być pod względem sprzętowym zgodna z bibliotekami OpenGL 2.0 i Microsoft DirectX 10 oraz modelem cieniowania Shader Model 4.0. Duży nacisk położony został na dekodowanie materiałów wideo. Dzięki wbudowanym w moduł graficzny dekoderom, może on odciążyć jednostkę centralną komputera od pracochłonnego wykonywania takich operacji związanych z dekodowaniem obrazu jak, jak obliczanie odwrotnej, dyskretnej transformaty kosinusowej (iDCT), kompensacji ruchu, deinterlacingu i korekcji kolorów. Sprzętowe dekodowanie materiałów wideo możliwe będzie zarówno dla materiałów wideo zarówno w zwykłej rozdzielczości, jak i rozdzielczości HD. Pliki wideo mogą być zapisane w formatach AVC, VC1 i MPEG-2.
Nehalem ma mieć możliwość wbudowania modułów graficznych
Dwoma nowatorskimi technologiami związanymi z obróbką materiałów wideo są technologie Panel Fitter 2 oraz Non-Linear Anamorphic Scaling. Pierwsza z nich odpowiada za sprzętowe skalowanie obrazu, dostosowując go do aktualnej rozdzielczości wyświetlacza. Drga pozwala na przeskalowywanie obrazów zapisanych w formacie 4:3 do panoramicznego formatu 16:9 w sposób nieliniowy. Działa ona tak, aby obraz był jak najmniej zniekształcony w miejscach, w których koncentruje się wzrok widza. Algorytm skalowanie rozpoczyna rozciąganie od środka ekranu, a kończy przy jego krawędzi, przy czym deformacje w środku są minimalne, a na krawędziach największe, ale jednocześnie najmniej widoczne dla widza.
Zarządzanie zasilaniem
Bardzo interesującą technologią wprowadzoną w procesorach Intel Core i7 jest technologia dynamicznego zarządzania zasilaniem – Nehalem Turbo Mode. Pozwala ona na niezależnie odłączanie lub włączania zasilania dla każdego z rdzeni. Możliwe jest na przykład przejście pojedynczego rdzenia w tryb głębokiego uśpienia C6, niezależnie od pozostałych jednostek. Co więcej, prędkość działania zegara taktującego pozostałe rdzenie może w tym czasie być podniesiona, co ma na celu zwiększenie wydajności przetwarzanych zadań jednowątkowych przy jednoczesnym zachowaniu ogólnego bilansu cieplnego dla procesora. Istotne jest także to, że Nehalem Turbo Mode włączany jest z poziomu BIOS-u i nie wymaga dodatkowych sterowników w systemie operacyjnym.
Nehalem Turbo Mode
Cały system zasilania Nehalema jest bardzo elastyczny. Każdy moduł core i uncore, czyli zarówno same rdzenie, jak i pozostałe jednostki, takie jak pamięć cache L3, systemy I/O, kontroler pamięci RAM, kontrolery QPI są zasilane oddzielnie. W ramach każdej jednostki można niezależnie regulować zarówno napięcie zasilające, jak i częstotliwość jej taktowania. Do zarządzania systemem zasilania Nehalema zaprojektowano jednostkę Power Control Unit. Co ważne jest ona programowalna, dzięki czemu istnieje możliwość zmiany schematów zasilania w zależności od pojawiających się potrzeb.
Nowe gniazdo
Wbudowanie w procesory Intel Core i7 kontrolera pamięci DDR3 oraz zastosowanie nowej magistrali systemowej spowodowały, że nowy procesor musi korzystać z nowej podstawki. Gniazdem tym jest LGA 1366, które zastąpi obecnie używany socket LGA775.
Oczywiście wraz z Nehalemem pojawią się też nowe chipsety. Dla procesorów Intel Core i7 przeznaczony jest chipset X58 Express znany też pod kodową nazwą Tylersburg. Dla wielu osób istotną informacją jest to, że w chipsetach X58 zaimplementowano obsługę systemów graficznych SLI firmy Nvidia korzystających z dwóch lub trzech kart graficznych. Do niedawna na platformie Intela można było wyłącznie stosować wielokartowe systemy CrossFire firmy ATI.