"We are back" « oc.at

Legends never die: GPUPI

mat 06.11.2014 - 01:52 413917 878 Thread rating
Posts

Error404

Dry aged
Avatar
Registered: Mar 2006
Location: Kimosabe
Posts: 2974
[X] CUDA support, damit meine 980er wieder weiter vorne mitmischen kann! :D

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Mühsam ernährt sich das Eichhörnchen ...

Heute Abend war ein schöner Schritt für die Version 1.3 möglich, leider bin ich trotzdem noch nicht fertig geworden. Hoffentlich morgen, denn ich möchte gerne spätestens zum Wochenende den GPUPI OC Contest starten. Wir haben uns einiges überlegt und eine kleine Überraschung vorbereitet. :)

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Der erste erfolgreiche Durchlauf auf 1M mit CUDA:

gpupi-cuda_198669.png

Noch keine Optimierungen und Memory Reduction findet derzeit testweise auf der CPU statt.

sichNix

Here to stay
Registered: Nov 2014
Location: 1230
Posts: 1079
nice mat, die beta könntest ja schonmal rausgeben zum spielen ^^

Error404

Dry aged
Avatar
Registered: Mar 2006
Location: Kimosabe
Posts: 2974
1.3 ftw! :)

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Ist noch etwas früh für ein Release.

Ich kann euch aber schon verraten, dass es gut für CUDA ausschaut. Zumindest was 1M und 100M angeht, 1B bleibt noch spannend und Memory Reduction ebenso.

InfiX

she/her
Avatar
Registered: Mar 2002
Location: Graz
Posts: 14450
aber ned CUDA jetzt besser optimieren :D

Error404

Dry aged
Avatar
Registered: Mar 2006
Location: Kimosabe
Posts: 2974
Schon! :D

Rogaahl

Elder
interrupt
Avatar
Registered: Feb 2014
Location: K
Posts: 2391
@mat
Hast du eigentlich Contact von Carl Sagan gelesen? Mit GPUPI könnte man doch super Anomalien finden. :D

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Mittlerweile ist die CUDA-Implementierung vollständig und lässt problemlos 10B durchlaufen. :cool:

gpupi-cuda-10b-result_198711.png

Jetzt noch einige, zum OpenCL-Teil faire Optimierungen und dann folgt das Release. :)

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Die letzten Tests mit 32B :eek: laufen durch!

Hier eine kleine Gegenüberstellung in 100M:

gpupi-1-3-beta-last-tests_198720.png

Das Release kommt in wenigen Stunden. :shake:

lalaker

TBS forever
Avatar
Registered: Apr 2003
Location: Bgld
Posts: 14699
Bin schon gespannt, wie die Nvidia-Grakas dann einschlagen werden ;)

creative2k

eigentlich mag ich nimmer
Avatar
Registered: Jul 2002
Location: Vienna
Posts: 8480
Ich bin bissl spät dran aber: Ich finds super mat, dass du Turrican den Bench gewidmet hast!

Ich hab zwar im Moment nicht so die Zeit, um meine Graka zu quälen und rumzutesten, aber ich hab mir fest vorgenommen die classified nochmal Turrican zu ehren zu quälen und nen score zu setzen :)

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Danke. Heb dir die Resultate für den geplanten OC-Contest mit GPUPI auf. Da wird es dann auch wirklich sinnvoll, ihr werdet sehen. :)

Meanwhile ...

CUDA und 32B! :cool:

gpupi-32b-cuda-first-test_198723.png

mat

Administrator
Legends never die
Avatar
Registered: Aug 2003
Location: nö
Posts: 25517
Und hier ist 32B mit OpenCL. :cool:

Knapp 2 Minuten langsamer, also leider nicht viel um. Die CUDA-Implementierung hat dafür deutlich mehr Potenzial, um noch mehr optimiert zu werden. Speziell die Memory Reduction ist ein wenig unfair, weil die Kernels in CUDA als (sehr leicht handhabbare) C++ Template-Functions definiert werden, während für OpenCL die Kernels doch durch den JIT-Compiler und diversen Präprozessor-Definitionen besser zugeschnitten werden können. Das liegt aber eher am Konzept, dem ich jeweils auch nachgegangen bin, anstatt alles 1:1 zu machen. Für mich ist das Teil der Geschwindigkeit einer GPGPU-API.

gpupi-32b-opencl-first-test_198735.png
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz