Nvidia Tesla V100 - topowy akcelerator obliczeniowy również w wersji pod PCIe

22 czerwca 2017przeczytasz w 2 min.

Tesla V100 to najpotężniejszy akcelerator obliczeniowy, który przyspieszy rozwój obliczeń wysokiej wydajności oraz sztucznej inteligencji.

Miesiąc temu Nvidia zaprezentowała kartę graficzną Tesla V100, a więc pierwszy akcelerator z nowej generacji Volta – wtedy jeszcze jako karta typu Mezzanine (SXM2). Teraz w ofercie producenta pojawiła się jej wersja pod standardowe złącze PCI-Express x16.

Tesla V100 PCIe również wykorzystuje układ graficzny Volta GV100 z 5120 procesorami strumieniowymi i 640 rdzeniami tensor oraz 16 GB pamięci HBM2 4096-bit. Zmieniło się natomiast taktowanie rdzenia, bo pracuje on maksymalnie z częstotliwością około 1370 MHz (w wersji SXM2 jest to 1455 MHz).

Rdzeń Volta GV100 składa się z 80 bloków SM, które łącznie dają 5120 procesorów strumieniowych. Nowością jest natomiast 640 jednostek tensor core, które są wykorzystywane do uczenia maszynowego i budowy sieci neuronowych

Mimo zmian w zegarach, karta oferuje podobną moc obliczeniową – 28 TFLOPS połowicznej precyzji, 14 TFLOPS pojedynczej precyzji i 7 TFLOP Spodwójnej precyzji (w wersji SXM2 jest to odpowiednio 30, 15 i 7,5 TFLOPS). Moc obliczeniowa przy głębokim uczeniu to z kolei 112 zamiast 120 TFLOPS. Przepustowość pamięci pozostała bez zmian i wynosi aż 900 GB/s.

Tesla V100 PCIe wykorzystuje interfejs PCI-Express 3.0 x16, więc przy połączeniu kilku kart przepustowość wynosi „tylko” 32 GB/s (w wersji SXM2 można wykorzystać magistralę NVLink o przepustowości 300 GB/s). Niższe zegary wpłynęły jednak na niższy pobór energii elektrycznej, bowiem współczynnik TDP wynosi już tylko 250 zamiast 300 W.

Model	Tesla P100 (SXM2)	Tesla P100 (PCIe)	Tesla V100 (SXM2)	Tesla V100 (PCIe)
Generacja	Nvidia Pascal	Nvidia Pascal	Nvidia Volta	Nvidia Volta
Litografia	TSMC 16 nm FinFET	TSMC 16 nm FinFET	TSMC 12nm FFN	TSMC 12nm FFN
Powierzchnia rdzenia	610 mm²	610 mm²	815 mm²	815 mm²
Układ graficzny	Pascal GP100	Pascal GP100	Volta GV100	Volta GV100
Taktowanie rdzenia	1480 MHz	1300 MHz	1455 MHz	~1370 MHz
Moc obliczeniowa FP16	21,2 TFLOPS	18,7 TFLOPS	30 TFLOPS	28 TFLOPS
Moc obliczeniowa FP32	10,6 TFLOPS	9,3 TFLOPS	15 TFLOPS	14 TFLOPS
Moc obliczeniowa FP64	5,3 TFLOPS	4,7 TFLOPS	7,5 TFLOPS	7 TFLOPS
Moc obliczeniowa tensor (Deep Learning	-	-	120 TFLOPS	112 TFLOPS
Pamięć wideo	16 GB HBM2 4096-bit	16 GB HBM2 4096-bit	16 GB HBM2 4096-bit	16 GB HBM2 4096-bit
Przepustowość pamięci	720 GB/s	720 GB/s	900 GB/s	900 GB/s
Typ karty	Mezzanine (SXM2)	PCIe 3.0 x16	Mezzanine (SXM2)	PCIe 3.0 x16
Chłodzenie	pasywne	pasywne	pasywne	pasywne
TDP	300 W	250 W	300 W	250 W

Karta Tesla V100 PCIe ma być dostępna jeszcze w tym roku - zarówno w ofercie Nvidii, jak i gotowych systemach firm partnerskich (Hewlett Packard Enterprise przykładowo zapowiedział trzy systemy bazujące na tej konstrukcji).

Źródło: Nvidia, AnandTech

Komentarze

Zaloguj się, aby skomentować

Faflucy
2017-06-2216:59
1
Jeżeli jest tesla na PCI-E jest z pamięciami HBM2, to jest światełko w tunelu że może 2080Ti lub chociaż Titan pojawi się z HBM2.
Skaza
2017-06-2219:28
0

Ciekawe, czy kopacze bitcoinów zaintresują się... ;)
Pószek okrószek
2017-06-2223:23
-4
Przepraszam, ale musze zapytać czy Crysis na tym pójdzie?
Jedno jest pewne. Ta karta będzie w moim zasięgu finansowym za jakieś 6 lat.

Komentarze

Witaj!