NVIDIA przedstawiła dzisiaj przeznaczone na rynek obliczeń o wysokiej wydajności (HPC) procesory równoległe z serii Tesla 20, oparte na CUDA i architekturze nowej generacji oznaczonej kodową nazwą „Fermi”.
Zaprojektowane z myślą o obliczeniach równoległych, procesory graficzne NVIDIA Tesla z serii 20 redukują koszt oferując taką samą wydajność jak tradycyjny klaster wykorzystujący CPU, ale przy jednej dziesiątej jego kosztów i jednej dwudziestej jego zużycia energii.
Tesla 20 wprowadza nowe funkcje, które pozwalają wielu aplikacjom osiągnąć znacznie wyższą wydajność przy wykorzystaniu obliczeń na GPU. Wśród zastosowań znajdziemy raytracing, trójwymiarowe obliczenia w chmurze, kodowanie wideo, wyszukiwanie w bazach danych, analiza danych, komputerowo wspomagane konstruowanie i wyszukiwanie wirusów.
„NVIDIA zaproponowała w układzie Fermi bardzo atrakcyjną architekturę, oferującą zestaw funkcji, który udostępnia tę technologię dla całego przemysłu komputerowego”, powiedział Jack Dongarra, szef Innovative Computing Laboratory na Uniwersytecie Tennessee i współautor słynnych bibliotek LINPACK i LAPACK.
Procesory graficzne Tesla z serii 20 oferują funkcje obliczeń równoległych, które nigdy dotąd nie były oferowane w jednym urządzeniu. Należą do nich:
- Obsługa nowej generacji standardu obliczeń zmiennoprzecinkowych podwójnej precyzji IEEE 754-2008
- Obsługa kodów korekcyjnych ECC, zapewniająca bezkompromisową niezawodność i dokładność
- Wielopoziomową hierarchię pamięci podręcznej z pamięciami podręcznymi poziomów L1 i L2
- Obsługa języka programowania C++
- Obsługę do 1 TB pamięci, współbieżna obsługa jądra, szybkie przełączanie wątków, 10x szybsze operacje atomowe, 64-bitowa wirtualna przestrzeń adresowa, wywołania systemowe i funkcje rekursywne.
Rdzeń procesorów graficznych Tesla oparty jest na masowo równoległej architekturze obliczeniowej CUDA, oferującej twórcom oprogramowania model obliczeń równoległych łatwiejszy do zrozumienia i oprogramowania niż jakakolwiek alternatywa opracowania w ciągu ostatnich 50 lat.
Rodzina procesorów graficznych Tesla z serii 20 obejmuje:
- Procesory obliczeniowe GPU Tesla C2050 i C2070
- Karty PCI-Express Gen-2 z pojedynczym GPU dla stacji roboczych
- Do 3 GB i 6 GB (odpowiednio) wbudowanej pamięci GDDR5
- Wydajność podwójnej precyzji w zakresie od 520 GFlops do 630 GFlops
- Systemy obliczeniowe GPU Tesla S2050 i S2070
- Cztery procesory Tesla w systemie 1U przeznaczonym dla klastrów i centrów danych
- Do 12 GB i 24 GB (odpowiednio) pamięci systemowej w ramach wbudowanej pamięci GDDR5
- Wydajność podwójnej precyzji w zakresie od 2.1 TFlops do 2.5 TFlops
Produkty te dostępne będą w maju 2010. Więcej informacji na temat nowych produktów Tesla z serii 20 znaleźć można na stronach produktów Tesla.
Źródło: informacja prasowa
Komentarze
47michael od kiedy jestes fun ? xD
Uwazam ze upowszechnienie wykorzystania CUDA moze przyniesc skokowy wzrost wydajnosci w wilu dziedzinach - przede wszystkim w obrobce video, grafiki oraz renderingu 3D. Czyli w dziedzinach, ktore nadal cierpia na chroniczny niedobor mocy obliczeniowej :)
Dotychczas jedynym sposobem byl zakup szybszego procesora (lub kolejnego :)). Niedlugo moze sie okazac, ze bardziej oplacalne bedzie zakupienie kolejnej karty graficznej.
nVidia bardzo silnie promuje CUDA - oby tylko ATI nie zaspalo ze swoim Stream. Oczywiscie najkorzystniejesze byloby rozwiazanie niezalezne od platformy sprzetowej, tylko czy to mozliwe?
Moim skromnym zdaniem jest to rowniez powod, dla ktorego Intel pracuje nad Larabee - byc moze nie chodzi przede wszystkim o rynek kart graficznych, ale zeby nie obudzic sie z reka w nocniku, kiedy procesor bedzie tylko dodatkiem do poteznego ukladu GPU wykonujacego wiekszosc czasochlonnych obliczen...
muahahah :D z takim czymś to nie ma co czekać na GeForce'y, do nowego kompa kupie radzia tylko teraz 5870 czy 5970 ... zalezy od ceny i oczywiscie wydajnosci
Po co nam nowy GeForce?
Chce ktos grafike co roku zmieniac?
Czy cokolwiek dzis nie ruszy na full detal na chocby GTX 260 ?
Jak czytam te nowinki, to mi sie cisna komentarze: funckje rekursywne pomoga nowemu Fermiemu zapetlic sie samemu w sobie ;-)
Albo: 10x szybsze operacje atomowe stanowia niebezpieczny proceder dla niewlasciwego wlasciciela, gdyz w razie rozszczepienia grozi to kataklizmem ;-)
Tudziez: 64-bitowa wirtualna przestrzen adresowa, to brzmi jak wirtualny 8-bitowy procesor w naszym Core i7.
2.5 tflopsow na jednej karcie, gdzie mozna smialo dac 4 karty naraz....
obecnie 4x tesle daja 4 tflopsy.... a tutja bedzie 10.... niezly skok wydajnosc 2.5x :D
"Zapowiada się świetnie. Tylko czemu tak późno ?!!
Edit:
# Obsługa nowej generacji standardu obliczeń zmiennoprzecinkowych podwójnej precyzji IEEE 754-2008
# Obsługa kodów korekcyjnych ECC, zapewniająca bezkompromisową niezawodność i dokładność
# Wielopoziomową hierarchię pamięci podręcznej z pamięciami podręcznymi poziomów L1 i L2
# Obsługa języka programowania C++
# Obsługę do 1 TB pamięci, współbieżna obsługa jądra, szybkie przełączanie wątków, 10x szybsze operacje atomowe, 64-bitowa wirtualna przestrzeń adresowa, wywołania systemowe i funkcje rekursywne.
koniec cyt.
Z tego wszystkiego to HD58xx nie ma tylko możliwości uruchamiania wielu aplikacji równocześnie i wbudowanego kompilatora C++, jest ograniczone w adresowaniu pamięci i nie ma tak elastycznego dostępu do cache.
Ale chyba jeszcze nie ma wersji kart FirePro na 58xx więc nie wiadomo co tak naprawdę będzie można odpalić na HD58xx.
Z drugiej strony to są zapowiedzi na papierze. Mam nadzieję że nVidia zdąży z tą rewolucją przed Fusion i Larrabe."