COLOSSUS
AdministratorGNUltra
|
Hi! Ein guter Freund von mir arbeitet gerade an seinem ersten eigenen Projekt nach dem Abschluss des Doktorats aus Mathematik. Dafuer muss er ein aufwendig zu berechnendes Problem loesen - und hat dazu ein Programm geschrieben, das eine aktuelle High-End-GPU einige Monate bis Jahre voll auslasten wird. Jetzt moechte er gerne rausfinden, welche Karten/GPU-Architekturen fuer den in seine Berechnung involvierten GPU-Shader am besten geeignet sind. Auf meine Bitte hin ein hat er dafuer ein Micro-Benchmark aus seinem eigentlichen Programm herausgeloest, das diese Frage mit eurer Mithilfe hoffentlich empirisch beantwortbar macht. Ich habe ihm versprochen, es auf OC.at zu posten, weil weil es hier eifrige Rekordjaeger mit einer riesigen Vielfalt an Hardware gibt - die sicherlich bei der Entscheidungsfindung, wofuer ein Teil des Projektbudgets letztendlich draufgehen soll, helfend beistehen koennen (und hoffentlich wollen) Nachdem mein Freund kein geuebter Applikationsentwickler ist, ist die Anwendung bzw. das Benchmark in der Handhabung nicht wahnsinnig bequem - es ist ein Windows-CLI-Programm, das kurz nach dem Starten auf unseren NVIDIA-GPUs unter Windows 7 und Windows 10 dazu fuehrt, dass der "Timeout Detection & Recovery (TDR)"-Mechanismus des Grafiktreibers aktiv wird, und den Benchmark-Prozess erbarmungslos erdolcht. Deswegen ist es vor dem Ausfuehren des Benchmarks notwendig, das Default-Timeout fuer TDR (es betraegt ab Werk etwa 2 (zwei) Sekunden, soweit ich das gesehen habe) ueber die Registry entweder auszer Kraft zu setzen, oder drastisch anzuheben, und dann den Host zu rebooten. (Weiter unten findet ihr einen Link zu einem Registry-Patch, der das Timeout auf meiner Kiste auf 255 Sekunden anhebt.) Danach laeuft SinusGPU.exe auf meiner GeForce 970 problemlos durch, und ich erhalte ein verwertbares Ergebnis. Ob das fuer AMD/Radeon-User auch ein Problem ist, weisz ich nicht - ich waere jedenfalls sehr gespannt auf eure Rueckmeldungen! Falls jemand von euch beim Ermitteln der geeignetsten GPU mitmachen moechte, dann bitte: - (Evtl. nur fuer NVIDIA-User relevant?) Ladet den TDR-Registry-Fix runter und wendet ihn mit einem Rechtsklick und "Zusammenfuehren" an → https://johannes.truschnigg.info/upload/TdrDelayFix.reg
- (Nur, falls ihr den TDR-Registry-Fix angewandt habt.) Rebootet euren PC
- Ladet das SinusGPU.zip-Archiv herunter und entpackt es → https://johannes.truschnigg.info/upload/SinusGPU.zip
- Startet SinusGPU.exe waehrend die Maschine ansonsten vollstaendig idle ist, und wartet, bis es fertig gerechnet hat (meine GeForce 970 rechnet ~50 Sekunden - es kann sein, dass das Bild waehrend des Durchlaufs scheinbar "einfriert"; das ist kein Grund zu Panik )
- Postet einen Screenshot des SinusGPU-Fensters in diesen Thread und/oder die Daten daraus textuell, und gebt dabei detailliert Auskunft ueber die verwendete Grafikkarte, Betriebssystem und Treiberversion
Vielen herzlichen Dank fuer eure Hilfe! Mein Freund hat noch diese kurze Erklaerung der Ausgabe (Screenshot von einem Durchlauf am Windows 7-Laptop mit einer NVIDIA Mobile GPU) beigelegt
|
userohnenamen
leider kein name
|
hier bitte Windows 10 E 1703, Geforce GTX 980 TI, 22.21.13.8476 (bzw. 384.76) vom 27.06.2017 wlkikiv Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 21:04:15:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 32935
Bearbeitet von userohnenamen am 25.09.2017, 21:13
|
argh
Here to stay
|
Win 10 Pro, Version 1703 Sapphire RX 470, 8gb 1260 GPU Takt, 2100 VRAM. Driver Packaging Version 17.10.3211-170606a-314971E-CrimsonReLive Max global work group sizes, x: 65535, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1024, y: 1024, z: 1024
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1024
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 20:58:14:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 418.46475
esup = 0.051325545
time = 83907
|
erlgrey
formerly known as der~erl
|
Win 10 pro, Version 1703 R9-290 tri-x 4gb (standard 1000-1300) Crimson 17.9.2 Max global work group sizes, x: 65535, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1024, y: 1024, z: 1024
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1024
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 20:59:17:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 418.46475
esup = 0.051325545
time = 110322
Enter anything to close.
btw. crash ohne tdrfix auch hier.
|
argh
Here to stay
|
btw. crash ohne tdrfix auch hier. stimmt, hatte ich vergessen zu posten. also trifft es auch auf amd zu.
|
COLOSSUS
AdministratorGNUltra
|
Wow, danke schon einmal fuer die Resultate! Der vollstaendigkeit halber der Score meines Spiele-Rechners: Windows 10 Pro x86_64/17.03 NVIDIA GeForce 970 4GB, Treiber in Version 385.69: Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 21:10:44:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 45309
Enter anything to close.
Edith meint noch: Ich hab offengestanden keine Ahnung, was genau berechnet wird - aber wie der eine Wert zwischen NVIDIA und AMD zu "springen" scheint macht mir irgendwie Sorgen, dass der Shader nicht mit beiden Treibern das selbe berechnet Ich werde das mal zu erfragen suchen...
|
semteX
begehrt die rostschaufel
|
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 21:11:49:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 39687
Enter anything to close.
GTX 970 auf 1.5ghz übertaktet. keine crashes, auch ohne fix
|
böhmi
AdministratorSpießer
|
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 22:24:40:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 25334
Enter anything to close.
1080Ti
|
Hampti
Overclocking Team Member
|
Ok man sieht gleich dass NV hier eindeutig die Nase vorne hat.
|
DAO
Si vis pacem, para bellum
|
Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024)
Compiling program Creating buffer Starting computation
0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4
25.09.2017, 22:35:33: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 80998
Enter anything to close.
Quadro M4000M -> Thinkpad OS: Win 10 Enterprise 10.0.15063]
Bearbeitet von DAO am 25.09.2017, 22:41
|
Crash Override
BOfH
|
1080 auf 50% TDP Limit ohne fix:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024)
Compiling program Creating buffer Starting computation
0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4
25.09.2017, 22:58:30: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 24528
Enter anything to close.
100% TDP: Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024)
Compiling program Creating buffer Starting computation
0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4
25.09.2017, 22:52:46: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 21299
Enter anything to close.
116% TDP, +150Mhz: Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024)
Compiling program Creating buffer Starting computation
0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4
25.09.2017, 23:00:42: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 19938
Enter anything to close.
Bearbeitet von Crash Override am 25.09.2017, 23:01
|
Garbage
AdministratorThe Wizard of Owls
|
Ok man sieht gleich dass NV hier eindeutig die Nase vorne hat. Kann sein, oder auch nicht. Man sieht ja, dass die Ergebnisse zwischen Nvidia und AMD Karten nicht ident sind, somit hats hier was. Und was bei Architektur N gut funktioniert, muss nicht zwangsläufig auch bei A gut sein. Da müsste man wohl direkt auf unterschiedliche Architekturen hin optimieren.
|
smashIt
master of disaster
|
Hi! Dafuer muss er ein aufwendig zu berechnendes Problem loesen - und hat dazu ein Programm geschrieben, das eine aktuelle High-End-GPU einige Monate bis Jahre voll auslasten wird. rein aus interesse: gibts ein paar mehr infos zu dem problem? ergebnisse von meiner hd7850 werden wohl nicht intressant sein
|
Denne
Here to stay
|
Windows 10 (64bit), Xeon E3-1230 v3, Geforce GTX 1070 (Treiberversion: 385.41) Den TDR-Registry-Fix musste ich btw nicht anwenden, ging auch ohne problemlos. Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
26.09.2017, 09:57:57:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 26616
Enter anything to close.
|
wergor
connoisseur de mimi
|
GTX 780 ForceWare 382.05 WHQL Windows 10 Pro N 15063.608 Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
26.09.2017, 21:40:09:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 61961
Enter anything to close.
|