Nowe układy nie różnią się znacznie pod względem budowy od układu R600 będącego sercem kart HD2900. Zmiany dotyczą bloków zunifikowanych shaderów (zdolności do wykonywania kodu Shader Model 4.1) oraz węższej o połowę szyny pamięci, pracującej w układzie RingBus. Wszystko upakowano w 666 mln tranzystorów, wykonanych w 55 nanometrowym procesie produkcyjnym. Zmniejszono napięcie zasilające rdzeń, dając karcie nieco "odetchnąć" jeżeli chodzi o wydzielane ciepło. Maksymalne TDP dla Radeona HD3870 wynosi ~105W, a dla HD3850 ~90-95W. To bardzo mało patrząc na pobór mocy poprzednika opartego o R600 180~200W.
GeForce | Radeon | Radeon | Radeon | |
nazwa kodowa liczba tranzystorów techn. wykonania | G92 754 mln 65nm | R600 700 mln 80nm | RV670 666 mln 55nm | R670 666 mln 55nm |
maksymalne TDP | ~110W | ~200W | ~105W | ~90W |
potoki renderujące | 16 | 16(4rbe) | 16(4rbe) | 16(4rbe) |
ilość proces. strumieni | 112 | 64/320 | 64/320 | 64/320 |
częstot. rdzenia częstot. VS | 600 MHz 1512 MHz | 742 MHz | 780 MHz | 670 MHz |
wydajność Gflops wydajność MTtex/s | 508 Gflops 33,600 | 475 Gflops 24,000 | 499 Gflops 33,600 | 429 Gflops 36,800 |
częstotliwość pamięci | 900 MHz (efekt. 1800) | 826 MHz (efekt. 1655) | 1126 MHz (efekt. 2250) | 826 MHz (efekt. 1655) |
przepustowość pamięci | ~56 GB/sek. | ~103 GB/sek. | ~70 GB/sek. | ~52 GB/sek. |
rozmiar pamięci szyna danych pamięci | 512 MB 256-bitowa | 512 MB 512-bitowa | 512 MB 256-bitowa | 256 MB 256-bitowa |
HDMI | tak | tak + Audio 5.1 | tak + Audio 5.1 | tak + Audio 5.1 |
sprzętowa obsługa formatów HD | tak (PureVideo HD 2 gen) | tak (AvivoHD) | tak (AvivoHD) / UVD | tak (AvivoHD) / UVD |
magistrala | PCI-E 16x (v1.1/v2.0) | PCI-E 16x (v1.1) | PCI-E 16x (v1.1/v2.0) | PCI-E 16x (v1.1/v2.0) |
chłodzenie | aktywne jedno-slotowe | aktywne dwu-slotowe | aktywne dwu-slotowe | aktywne jedno-slotowe |
Procesor graficzny RV670 ma tyle samo jednostek wykonawczych co HD2900XT, a więc łącznie 16 render back-ends (4 jednostki podzielone na 4 bloki), oraz 16 jednostek teksturujących TMU (adres i filter). Jednostka zunifikowanych shaderów to 64 stream procesory zdolne wykonać do 320 instrukcji na cykl pracy.
Dzięki zmniejszeniu procesu produkcji, a co za tym idzie, zmniejszeniu wydzielanego ciepła, Radeon HD3850 zadowala się jednoslotowym chłodzeniem, podobnie zresztą jak nowy GeForce 8800GT nvidii. Wentylator na produkcie ATI jest jednak nieco cichszy w górnej partii obrotów i wg producenta charakteryzuje się głosnością ~31dB. "Dwuslotowy" HD3870 jest niewiele głośniejszy i jego średnie parametry "odsłuchowe" to 34dB.
Radeon HD3870 jest kartą Radeon HD trzeciej generacji (3), należącym do rodziny układów wydajnych (8), w wariancie "mocniejszym" (70), czyli dawnym odpowiedniku oznaczenia XT. HD3850 zatem to odpowiednik kart znanych jako wariant PRO.
DirectX 10.1 - Shader "Model" po liftingu
Wprowadzanie w układach graficznych coraz bardziej złożonych bloków odpowiedzialnych za przetwarzanie skomplikowanych obliczeń na shaderach jest chyba najważniejszą dziedziną ich rozwoju w ostatnim czasie. Nie ulega wątpliwości, że dzisiejsze oprogramowanie (w tym głównie gry) nie nadążają za postępem w dziedzinie sprzętu. API DirectX10 wprowadzone wraz z systemem Vista, wywołało u większości graczy mieszane odczucia, a co dla niektórych nawet pewien niesmak. To co miało oznaczać większą wydajność, lepszy obraz, mniejsze obciążenie jednostki centralnej okazało się w znacznej części mrzonką. Już dziś można stwierdzić, że obecne karty segmentu średniego, czy średniego - wyższego nie poradzą sobie w tym trybie na tak zoptymalizowanych programach jakie wypuszczane są do tej pory.
Wprowadzenie poprawionego "dajrekt iksa" w nowych układach ATI RV670, znów wprowadza nieco zamieszania natury "specyfikacyjnej". To, że karty są nowoczesne, nie ulega wątpliwości, tyle, że na chwilę obecną nic z tego wynikać nie będzie - brak oprogramowania (gier), oraz co ważniejsze odpowiednich bibliotek DX, które ma wprowadzić pierwszy Service Pack do Windows Vista. Wg wstępnych zapowiedzi jednak, nie będzie gier pisanych specjalnie pod to API, a tylko stosowne łatki pozwalające uzyskać wymiernie lepszą jakość obrazu (wyższa precyzja shaderów, wyższa precyzja filtrowania tekstur, czy poprawione custom i adaptive AA).
Warto jednak wiedzieć, jakie korzyści uzyskamy używając kart budowanych w niedalekiej przyszłości, oraz czy warto się nad tym w ogóle zastanawiać.
Czym zatem różni się nowy model cieniowania (SM4.1) od poprzedniego (SM4.0)? Ponieważ to, że ostatnią liczbą po przecinku, raczej wszyscy wiemy ;) Czym ponadto?
Główne zmiany dotyczą zniesienia kilku ograniczeń SM4.0, między innymi precyzji oświetlenia globalnego (global illumination) - miękkie cienie, realistyczne refleksy. W nowym modelu cieniowania programiści mogą już korzystać z większej ilości "cube map" i możliwości shadera geometrii aby tworzyć w/w efekty w czasie rzeczywistym. Technika ta jest także bardziej skalowalna z liczbą zastosowanych układów graficznych (lepsza optymalizacja CrossFireX).
Dużo zmian poczyniono także poprzez zwiększenie precyzji obliczeń (pixel / vertex) shaderowych, co może mieć wymierny wpływ na jakość obrazu przy użyciu gier z obsługą tego API.
Dość znacznym usprawnieniem może poszczycić się także jednostka filtrująca/teksturująca zdolna obecnie do operowania na 32-bitowych danych zmiennoprzecinkowych.
generowanie bardziej realistycznych miękkich cieni, na podstawie specjalnej tekstury, dzięki technice Gather4
(4 próbki koloru, łącznie z blendingiem, pobierane w tym samym czasie)
ATI/AMD ponadto, chwali się poprawioną wydajnością i elastycznością trybów MSAA, w tym CustomAA. W nowym "Shader Modelu" wszystkie bufory próbek anty-aliasingu będą dostępne bezpośrednio z poziomu shaderów. Poprzednio niemożliwym było sięgnąć do bufora głębi dla każdej takiej próbki indywidualnie. Wg. producenta układu daje to programistom większą swobodę przy implementacji CustomAA, odwołując się do hardware'u bezpośrednio poprzez programy shaderowe. Obecnie antyaliasing jest piętą achillesową całej serii Radeon HD, właśnie za sprawą niedopracowanych driverów, ale i wynikających z kilku ograniczeń specyfikacji DirectX10 i jej obsługi przez te układy. Warto zatem poczekać na pierwsze "protezy" DX10.1 dla gier i ocenić czy zmiany wpłyną w jakikolwiek sposób na podniesienie wydajności przy użyciu "bardziej programowalnego" wygładzania krawędzi.