Topowy układ graficzny Nvidia Pascal osiągnie 12 TFLOPS mocy obliczeniowej?
Nowa generacja procesorów graficznych Nvidii pozwoli budować dużo wydajniejsze superkomputery. Na jakie osiągi możemy liczyć?
Nowa generacja kart graficznych Nvidia Pascal sprawdzi się nie tylko w komputerach stacjonarnych, ale również przy profesjonalnych zastosowaniach – w przypadku topowego rdzenia możemy spodziewać się rekordowej mocy obliczeniowej... a przynajmniej tak twierdzi jeden z wykładowców centrum superkomputerów w Barcelonie.
Manuel Ujaldon opublikował na stronie uczelni prezentację dotyczącą pamięci 3D i ich wpływu na rozwój superkomputerów. Na jednym ze slajdów porównał moc obliczeniową procesorów centralnych (CPU) i układów graficznych (GPU) – pośród nich znalazł się właśnie nowy rdzeń na bazie architektury Pascal z pamięciami 3D (najprawdopodobniej chodzi o topowy model Pascal GP100).
Układ graficzny z generacji Pascal podobno zaoferuje 12 TFLOPS mocy obliczeniowej pojedynczej precyzji i 4 TFLOPS mocy obliczeniowej podwójnej precyzji. Wychodzi więc na to, że osiągi wzrosłyby 3-krotnie względem topowego rdzenia z generacji Kepler (Kepler GK110), a porównując samą moc obliczeniową pojedynczej precyzji, to nawet 2-krotnie względem topowego rdzenia z obecnej generacji Maxwell (Maxwell GM200). Należy bowiem pamiętać, że architektura Maxwell nie została zaprojektowana z myślą o profesjonalnych zastosowaniach i oferuje dużo gorsze możliwości dla obliczeń podwójnej precyzji.
Wprawdzie wykładowca przy tworzeniu prezentacji podobno konsultował się m.in. właśnie z firmą Nvidia, ale ujawnione informacje są nieoficjalne i należy do nich podchodzić z dystansem. Nie jest jednak tajemnicą, że procesory graficzne z generacji Pascal pozwolą osiągnąć dużo wyższą moc obliczeniową i znajdą zastosowanie w nowych superkomputerach (m.in. powstających właśnie Sierra i Summit).
Źródło: Barcelona Supercomputer Center
Komentarze
45http://ccoe.ac.upc.edu/_media/5_stackeddram-v41-4x1.pdf
Swoją drogą, jeżeli FP32 = 12 TFLOPS i Nvidia zapowiedziała, że wprowadzi w Pascalu mixed precision, czytaj FP16, co wespół z informacją/przeciekiem dot. mixed precision FP16 = 2 * FP32 dale nam 24 TFLOPS.
Jeżeli NVlinkiem będzie można połączyć 8 kart to mamy już 192 TFLOPS. To jest coś niesamowitego.