Fermi, czyli nowa architektura kart GTX serii 400, jest nieco inna od tego z czym mieliśmy do czynienia w przypadku „dwusetek”. Według podawanej specyfikacji, karty oparte na układach GF100 wykonane w 40 nm litografii mają znacznie mniej klasycznych jednostek teksturujących. O czym dowiecie się w dalszej części artykułu, są one jednak znacznie szybsze. Poczynione usprawnienia spowodowały, że w nowych grach (szczególnie tych pisanych pod DX11) bardziej elastyczne jednostki będą wykonywać operacje znacznie sprawniej niż było to możliwe do tej pory.
Najmocniejszy obecnie układ graficzny na rynku zawiera 16 bloków procesorów strumieniowych. W każdym z nich znajdziemy po 32 rdzenie – pieszczotliwie nazywane – CUDA, których łączna liczba w danym modelu zależna jest od konfiguracji aktywnych jednostek.
I tak GeForce GTX 480 zawiera łącznie 480 Cc (CUDA Cores), co daje 15 aktywnych bloków SM. Gdzie się zatem podział ten szesnasty? Prawdopodobnie, po uporaniu się z dostawami obecnych kart, oraz opracowaniu bardziej efektywnego odbierania ciepła, ujrzymy niebawem jeszcze mocniejszą wersję karty, której najsensowniejszym oznaczeniem wydaje się GTX 490.
Konfiguracja potokowa GTX 480, pomimo rezygnacji z bardziej rozbudowanego bloku TMU, prezentuje się okazale. 48 jednostek renderujących pomimo węższej szyny pamięci (384-bit – sześć 64 bitowych linii) przekłada się na zdolność do wypełnienia o ponad połowę większej ilości pikseli w ciągu jednego cyklu zegara aniżeli potrafił to zrobić GTX 285, a więc karta z 512-bitowym kontrolerem. Wykorzystanie pamięci GDDR5 dało także ogromną przepustowość całego podsystemu RAM, wynoszącą ponad 170 GB/s.
nazwa handlowa | GeForce GTX 280 | GeForce GTX 285 | GeForce GTX 480 |
nazwa kodowa rdzenia | GT200-A2 | GT200-B1 | GF100-375-A3 |
technologia wykonania | 65nm | 55nm | 40nm |
liczba tranzystorów | 1.400 mln | 1.400 mln | 3.000 mln |
powierzchnia rdzenia | 576 mm2 | 470 mm2 | 530 mm2 |
specyfikacja API | DX10 /SM4.0 | DX10 /SM4.0 | DX11 /SM5.0 |
maksymalne TDP | 236 W | 204 W | 250 W |
ilość jednostek rop | 32 | 32 | 48 |
ilość jednostek adresujących TA | 80 | 80 | 60 |
ilość jednostek tekst. TF | 80 | 80 | 60 |
ilość jednostek SP | 240 | 240 | 480 |
częstotliwość GPU | 602 Mhz | 648 Mhz | 700 Mhz |
wydajność wypełniania | 48160 MT/s | 51840 MT/s | 42000 MT/s |
częstotliwość shaderów | 1296 Mhz | 1476 Mhz | 1401 Mhz |
wydajność zmiennoprzecinkowa | 933 GFlops | 1063 GFlops | 2017 GFlops |
częstotliwość pamięci (QDR) | 1107 Mhz (2214 DDR) | 1242 Mhz (2484 DDR) | 924 Mhz (3696 QDR) |
przepustowość pamięci | 138,4 GB/s | 155,2 GB/s | 173,2 GB/s |
ilość i typ pamięci | 1024MB GDDR3 | 1024MB GDDR3 | 1536MB GDDR5 |
szyna pamięci | 512-bit | 512-bit | 384-bit |
magistrala | PCI-E 16x 2.0 | PCI-E 16x 2.0 | PCI-E 16x 2.0 |
chłodzenie | dwuslotowe | dwuslotowe | dwuslotowe |
sprzętowa obsługa formatów HD | tak (PureVideo HD 2nd gen) / VP3 | tak (PureVideo HD 2nd gen) / VP3 | tak (PureVideo HD 2nd gen) / VP4 |
multi-GPU | Tri-SLi | Tri-SLi | Tri-SLi |
dodatkowe zasilanie | 1x 6pin / 1x8pin | 2x 6pin | 1x 6pin / 1x 8pin |
Nowy górnopółkowy GeForce ma zdolność do obliczeń zmiennoprzecinkowych ponad dwukrotnie wyższą od poprzednika. Ma być także ponad trzykrotnie szybszy w Ray-Tracingu i niemal ośmiokrotnie w przypadku obliczeń o podwojonej precyzji, a więc tam, gdzie GTX 285 znacznie odstawał od Radeonów HD 5800. W momencie praktycznego wykorzystania karty do obliczeń wątkowych będzie to na pewno bardzo istotna właściwość.
Jedyną rzeczą, którą na tym etapie można zarzucić karcie 480 GTX, jest podawane przez producenta TDP sięgające aż 250W. Jak na kartę wykonaną w nowym procesie 40 nm wydaje się to naprawdę dużo.
Drugą z premierowych kart jest GeForce GTX 470. Konstrukcja od mocniejszej wersji różni się nie tylko taktowaniem, ale także konfiguracją aktywnych bloków przetwarzania. Częstotliwość pracy ustalono na poziomie 607 MHz dla układu, 1215 MHz dla rdzeni CUDA oraz 837 MHz dla pamięci GDDR5 (efektywnie 3348 MHz). Zwężona do 320-bitów szyna oraz ograniczenie ROP do 40 jednostek powodują, że przepustowość podsystemu pamięci jest tu znacząco mniejsza i wynosi około 130 GB/s.
Modelowi GTX 470 „zabrano” ponadto kolejny klaster SM. Do dyspozycji pozostaje ich zatem 14, co daje łączną liczbę 448 aktywnych jednostek CUDA Cores. Z ośmiu do siedmiu zmniejszono także ilość klastrów jednostek teksturujących. Wersja 470 ma ich 56.
nazwa handlowa | GeForce GTX 260-196 | GeForce GTX 260-216 | GeForce GTX 470 |
nazwa kodowa rdzenia | GT200-A2 | GT200-B1 | GF100-275-A3 |
technologia wykonania | 65nm | 55nm | 40nm |
liczba tranzystorów | 1.400 mln | 1.400 mln | 3.000 mln |
powierzchnia rdzenia | 576 mm2 | 470 mm2 | 530 mm2 |
specyfikacja API | DX10 /SM4.0 | DX10 /SM4.0 | DX11 /SM5.0 |
maksymalne TDP | 186 W | 206 W | 215 W |
ilość jednostek rop | 28 | 28 | 40 |
ilość jednostek adresujących TA | 64 | 72 | 56 |
ilość jednostek tekst. TF | 64 | 72 | 56 |
ilość jednostek SP | 196 | 216 | 448 |
częstotliwość GPU | 576 Mhz | 576 Mhz | 607 Mhz |
wydajność wypełniania | 36864 MT/s | 41472 MT/s | 33992 MT/s |
częstotliwość shaderów | 1296 Mhz | 1476 Mhz | 1401 Mhz |
wydajność zmiennoprzecinkowa | 715 GFlops | 805 GFlops | 1633 GFlops |
częstotliwość pamięci | 999 Mhz (1998 DDR) | 999 Mhz (1998 DDR) | 837 Mhz (3348 Mhz QDR) |
przepustowość pamięci | 109,2 GB/s | 109,2 GB/s | 130,8 GB/s |
ilość i typ pamięci | 896MB GDDR3 | 896MB GDDR3 | 1280MB GDDR5 |
szyna pamięci | 448-bit | 448-bit | 320-bit |
magistrala | PCI-E 16x 2.0 | PCI-E 16x 2.0 | PCI-E 16x 2.0 |
chłodzenie | dwuslotowe | dwuslotowe | dwuslotowe |
sprzętowa obsługa formatów HD | tak (PureVideo HD 2nd gen) / VP3 | tak (PureVideo HD 2nd gen) / VP3 | tak (PureVideo HD 2nd gen) / VP4 |
multi-GPU | Tri-SLi | Tri-SLi | Tri-SLi |
dodatkowe zasilanie | 2x 6pin | 2x 6pin | 2x 6pin |
TDP karty ustalono na poziomie 215W, co odpowiada miej więcej apetytowi na prąd wersji 275 poprzedniej generacji.
Obydwie karty są zgodne z modelem programowania procesorów graficznych SM 5.0. Obsługują w pełni API DirectX11, DirectCompute11 oraz Open CL. Bardziej optymalne wykorzystanie zasobów geometrycznych rdzenia powoduje też znaczne przyspieszenie w obliczeniach realistycznej fizyki PhysX.
Tańszy model karty został wyposażony w 1280 MB dedykowanej pamięci. Mocniejszy natomiast zawiera jej około 1,5 GB. Do niestandardowych pojemności w przypadku NVIDII zdążyliśmy się już przyzwyczaić i jak dobrze pamiętamy związane jest to bezpośrednio z konfiguracją jednostek adresowych w ROP-ach.
Obydwie nowe konstrukcje już niebawem będziecie mogli także porównywać w naszym komparatorze GPU.