Nvidia Tesla V100 - topowy akcelerator obliczeniowy również w wersji pod PCIe
Tesla V100 to najpotężniejszy akcelerator obliczeniowy, który przyspieszy rozwój obliczeń wysokiej wydajności oraz sztucznej inteligencji.
Miesiąc temu Nvidia zaprezentowała kartę graficzną Tesla V100, a więc pierwszy akcelerator z nowej generacji Volta – wtedy jeszcze jako karta typu Mezzanine (SXM2). Teraz w ofercie producenta pojawiła się jej wersja pod standardowe złącze PCI-Express x16.
Tesla V100 PCIe również wykorzystuje układ graficzny Volta GV100 z 5120 procesorami strumieniowymi i 640 rdzeniami tensor oraz 16 GB pamięci HBM2 4096-bit. Zmieniło się natomiast taktowanie rdzenia, bo pracuje on maksymalnie z częstotliwością około 1370 MHz (w wersji SXM2 jest to 1455 MHz).
Rdzeń Volta GV100 składa się z 80 bloków SM, które łącznie dają 5120 procesorów strumieniowych. Nowością jest natomiast 640 jednostek tensor core, które są wykorzystywane do uczenia maszynowego i budowy sieci neuronowych
Mimo zmian w zegarach, karta oferuje podobną moc obliczeniową – 28 TFLOPS połowicznej precyzji, 14 TFLOPS pojedynczej precyzji i 7 TFLOP Spodwójnej precyzji (w wersji SXM2 jest to odpowiednio 30, 15 i 7,5 TFLOPS). Moc obliczeniowa przy głębokim uczeniu to z kolei 112 zamiast 120 TFLOPS. Przepustowość pamięci pozostała bez zmian i wynosi aż 900 GB/s.
Tesla V100 PCIe wykorzystuje interfejs PCI-Express 3.0 x16, więc przy połączeniu kilku kart przepustowość wynosi „tylko” 32 GB/s (w wersji SXM2 można wykorzystać magistralę NVLink o przepustowości 300 GB/s). Niższe zegary wpłynęły jednak na niższy pobór energii elektrycznej, bowiem współczynnik TDP wynosi już tylko 250 zamiast 300 W.
Model | Tesla P100 (SXM2) | Tesla P100 (PCIe) | Tesla V100 (SXM2) | Tesla V100 (PCIe) |
Generacja | Nvidia Pascal | Nvidia Pascal | Nvidia Volta | Nvidia Volta |
Litografia | TSMC 16 nm FinFET | TSMC 16 nm FinFET | TSMC 12nm FFN | TSMC 12nm FFN |
Powierzchnia rdzenia | 610 mm2 | 610 mm2 | 815 mm2 | 815 mm2 |
Układ graficzny | Pascal GP100 | Pascal GP100 | Volta GV100 | Volta GV100 |
Taktowanie rdzenia | 1480 MHz | 1300 MHz | 1455 MHz | ~1370 MHz |
Moc obliczeniowa FP16 | 21,2 TFLOPS | 18,7 TFLOPS | 30 TFLOPS | 28 TFLOPS |
Moc obliczeniowa FP32 | 10,6 TFLOPS | 9,3 TFLOPS | 15 TFLOPS | 14 TFLOPS |
Moc obliczeniowa FP64 | 5,3 TFLOPS | 4,7 TFLOPS | 7,5 TFLOPS | 7 TFLOPS |
Moc obliczeniowa tensor (Deep Learning | - | - | 120 TFLOPS | 112 TFLOPS |
Pamięć wideo | 16 GB HBM2 4096-bit | 16 GB HBM2 4096-bit | 16 GB HBM2 4096-bit | 16 GB HBM2 4096-bit |
Przepustowość pamięci | 720 GB/s | 720 GB/s | 900 GB/s | 900 GB/s |
Typ karty | Mezzanine (SXM2) | PCIe 3.0 x16 | Mezzanine (SXM2) | PCIe 3.0 x16 |
Chłodzenie | pasywne | pasywne | pasywne | pasywne |
TDP | 300 W | 250 W | 300 W | 250 W |
Karta Tesla V100 PCIe ma być dostępna jeszcze w tym roku - zarówno w ofercie Nvidii, jak i gotowych systemach firm partnerskich (Hewlett Packard Enterprise przykładowo zapowiedział trzy systemy bazujące na tej konstrukcji).
Źródło: Nvidia, AnandTech
Komentarze
12Ciekawe, czy kopacze bitcoinów zaintresują się... ;)
Jedno jest pewne. Ta karta będzie w moim zasięgu finansowym za jakieś 6 lat.