Oxide Games: karty Nvidii nie wspierają kluczowej funkcji DirectX 12
Karty Nvidii mają nie wspierać asynchronicznych jednostek cieniujących, co wpływa na wydajność w nowych grach wykorzystujących DirectX 12.
Testy wydajności w grze Ashes of the Singularity w trybie DirectX 12 wywołały niemałe zamieszanie w sieci, bo pokazały ukryty potencjał kart graficznych AMD Radeon, co z kolei postawiło w gorszej sytuacji modele Nvidia GeForce. Okazuje się, że gorsze osiągi kart „zielonych” mogą wynikać z niepełnego wsparcia dla nowego interfejsu programowania - tak przynajmniej twierdzą twórcy gry Ashes of the Singularity.
Chodzi o asynchroniczne jednostki cieniujące (Async Shaders), czyli jedną z kluczowych funkcji interfejsu DirectX 12 – pozwala ona asynchronicznie realizować poszczególne zadania przez procesor graficzny, a to z kolei wpływa na skrócenie czasu renderowania, zwiększenie płynności animacji i minimalizację opóźnień (minimalizacja opóźnień ma szczególnie duże znaczenie w przypadku systemów VR - wirtualnej rzeczywistości).
We wszystkich układach graficznych AMD na bazie architektury GCN zastosowano technologię ACE (Asynchronous Compute Engine) - asynchroniczne silniki obliczeniowe, które pozwalają realizować funkcje asynchronicznych shaderów równolegle (bez przełączania się). Poniżej możecie zobaczyć filmik, który w prosty sposób wyjaśnia działanie tej technologii.
Jak twierdzi programista studia Oxide Games (odpowiedzialnego m.in. za grę Ashes of the Singularity), karty graficzne Nvidii nie posiadają natywnego wsparcia dla asynchronicznych jednostek cieniujących - konieczne było zatem wyłączenie ich obsługi, bo siłowe wymuszenie aktywacji po prostu dawało gorsze rezultaty.
Wychodzi więc na to, że obecne karty graficzne Nvidii mogą mieć problemy z uzyskaniem odpowiedniej wydajności w nowych grach – wprawdzie inżynierowie mogliby spróbować zaimplementować programową obsługę asynchronicznych shaderów, aczkolwiek i tak należy się liczyć z gorszym funkcjonowaniem takiego rozwiązania i słabszymi wynikami wydajności. Miejmy nadzieję, że kolejna generacja procesorów graficznych Pascal już nie będzie wybrakowana pod tym względem.
Asychroniczne jednostki cieniujące pozwolą uzyskać potężny wzrost wydajności - tak przynajmniej twierdzą marketingowcy AMD
Z czasem na pewno będzie przybywać gier wykorzystujących potencjał DirectX 12 (niedługo dołączy do nich nowy DeusEx), dzięki czemu karty „czerwonych” powinny nabrać wiatru w żagle – można podejrzewać, że na ich korzyść zadziała też wpadka „zielonych”. Niestety, na obecną chwilę większość graczy nadal żyje w erze DirectX 11, gdzie Radeony mają wyraźne problemy z narzutem na procesor, co w przypadku słabszych procesorów może objawiać się spadkami wydajności.
Wychodzi więc na to, że im szybciej DirectX 11 odejdzie w zapomnienie, tym lepiej dla AMD – potwierdza to również polityka firmy, która wyraźnie promuje nowoczesne API. Czy rzeczywiście przyniesie ono spektakularny wzrost wydajności? Cóż, czas pokaże...
Źródło: HardForum, Reddit, EuroGamer, AMD, inf. własna
Komentarze
71na guru3d 2dni temu był już o tym artykuł.
polityczna poprawność?
Tu macie komentarz:
People who read this should go to the SOURCE at beyond3D and read through to the rest for a PROPER interpretation because OP's interpretation is very wrong.
Async compute functionality would result in NO difference in time taken to complete the combined tasks of graphics + compute, because its running in parallel. What the programmers on b3d found, was Maxwell in fact cannot perform Async Compute, if you try to get it to, it reverts back to serial operation, graphics then compute, with the total time to completion the sum of those two tasks individually.
Really, go and read through, the programmers discuss what's going on and interpret the results much better than us laymen.
https://forum.beyond3d.com/threads/dx12-performance-thread.57188/page-9
This is what Sebbi (very well known long time programmer on b3d) had to say about this program:
The latency doesn't matter if you are using GPU compute (including async) for rendering. You should not copy the results back to CPU or wait for the GPU on CPU side. Discrete GPUs are far away from the CPU. You should not expect to see low latency. Discrete GPUs are not good for tightly interleaved mixed CPU->GPU->CPU work.
To see realistic results, you should benchmark async compute in rendering tasks. For example render a shadow map while you run a tiled lighting compute shader concurrently (for the previous frame). Output the result to display instread of waiting compute to finish on CPU. For result timing, use GPU timestamps, do not use a CPU timer. CPU side timing of GPU results in lots of noise and even false results because of driver related buffering.
TLDR: This program only test for functionality, if Async Compute functions, the time to completion is shorter than the sum of doing compute and graphics individually, because its running at the same time. If Async Compute does NOT function, the time to completion is identical to the sum of the compute & graphics workloads done separately. Maxwell shows the latter pattern, it cannot do Async Compute.
Adobe Lightroom już nie wyłącza się po aktywacji renderingu GPU,
usunięto błędy z wyświetlaniem obrazu w grze Wiedźmin 3: Dziki Gon po aktywacji antyaliasingu w trybie CrossFire,
Firefox już nie zamyka się samoczynnie, gdy aktywne są dwie lub więcej kart,
system już nie zawiesza się podczas grania w Call of Duty: Modern Warfare 3 lub Diablo III,
Metal Gear Solid V: Ground Zeroes nie wyłącza się podczas startu,
wyeliminowano problem z przekłamaniami tekstur w grze Call of Duty: Black Ops III w trybie DirectX 11,
funkcja FRTC już działa w grze Sword Coast Legends,
usunięto problem z działaniem Project Cars po ustawieniu antyaliasingu na D2SM,
rozwiązano problem z migotaniem obrazu w Watch Dogs po zmianie rozdzielczości,
naprawiono błąd z utratą dźwięku AMD HMDI po instalacji sterownika,
migotanie obrazu w F1 2015 już nie występuje, zarówno w grze, jak i benchmarku,
naprawiono błędy z wyświetlaniem tekstu w aplikacji Mapa dla Windows 10,
system już nie zawiesza się podczas instalacji sterowników dla kilku kart graficznych w systemie Windows 10.
AMD wypisało też kilka znanych problemów, które mogą pojawić się po instalacji nowych sterowników. Firma oczywiście pracuje nad ich eliminacją. Wśród nich znajdziemy m.in. możliwość wyłączenia się gry DiRT Rally działającej w trybie DirectX 11, jeśli gramy w nią na wybranych monitorach BenQ 144 Hz z FreeSync.
Wypowiedz z 2013
Twórca FXAA o PS4: "Gry na PlayStation 4 mogą być lata przed tymi z PC-tów.
"Według Timothiego jest to jak Sony podejdzie do systemu operacyjnego i bibliotek umożliwiających pisanie gier. Jeśli PS4 będzie miało OS pozwalający na obsługę zapytań aplikacji w czasie rzeczywistym (RTOS) i biblioteki w stylu libGCM z dostępem bezpośrednio do niskopoziomowych poleceń GPU, to gry zespołów 1st party będą lata przed tym co możemy zobaczyć aktualnie na PC-tach. Wyobraźcie sobie co Naughty Dog, Sony Santa Monica, Guerrilla Games czy Quantic Dream mogą zrobić z następną generacją. Oczywiście nie stanie się to od razu na starcie, gdyż ludzie muszą poznać lepiej sprzęt, a i biblioteki będą ewoluować, ale parę lat po starcie PS4 gry mogą wyglądać kilkanaście razy lepiej niż teraz. Timothy przyznaje, że jako osoba znająca tworzenie na PC-tach od podszewki, irytuje się, że Microsoft w DirectX nie umożliwia dostępu do niskopoziomowych poleceń GPU"
"Jeśli chodzi o same GPU, które ma być oparte na Radeonie 7970M, którego architektura jest już znana publicznie. Z tego co wiadomo, można wywnioskować z technologii AMD, że w konsoli znaleźć się może asynchroniczny czas zapytań, który pozwoli na wiele optymalizacji względem tego co było do tej pory. I tutaj wkracza bardzo dużo technicznej rozmowy i pojęć, które kojarzyć będą głównie programiści lub osoby mocno interesujące się tworzeniem gier. Jednak ogrom nowych technologii pozwoli na osiągnięcie znacznie więcej niż ktokolwiek może sobie wyobrażać. I właśnie w tym Timothy widzi szansę Sony. Nawet jeśli na papierze sprzęt może wydawać się średni (co sugerują osoby rzucające teraflopami bez zrozumienia tego jak tworzy się gry), to biblioteki, które Sony udostępni mogą zdziałać cuda"
Przepowiednia się sprawdziła he.
Exy z PS4 pokazują w którym miejscu jest pcmr.....w wielkiej pup......
Już dawno zostawiłem ten cały syf pctowy ech......
dosc ciekawy tekst na ten temat.
Jesli autor sie nie myli to jest to wywolanie burzy w szklance wody podobnie jak to bylo przy infoterrorze o GTX970 i wyspie filmikow na YT ktore to mialy potwierdzic ze sposob dzielenia w nim pamieci powoduje shuttering w grach. ( co pozniej okazało sie ze bylo po prostu nieprawda).
ja wam radze poczekac zanim zaczniecie sprzedawac 980tki za grosze :D
dosc ciekawy tekst na ten temat.
Jesli autor sie nie myli to jest to wywolanie burzy w szklance wody podobnie jak to bylo przy infoterrorze o GTX970 i wyspie filmikow na YT ktore to mialy potwierdzic ze sposob dzielenia w nim pamieci powoduje shuttering w grach. ( co pozniej okazało sie ze bylo po prostu nieprawda).
ja wam radze poczekac zanim zaczniecie sprzedawac 980tki za grosze :D