Legends never die: GPUPI - Seite 37

Seite 37 von 59 - Forum: Number Crunching auf overclockers.at

URL: https://www.overclockers.at/number-crunching/legends-never-die-gpupi_240993/page_37 - zur Vollversion wechseln!


Garbage schrieb am 21.02.2015 um 20:29


mat schrieb am 21.02.2015 um 22:04

Es wäre möglich, auch mit Intel + NVIDIA. Nur habe ich es in die aktuelle Version nicht eingebaut und zwar aus 2 Gründen: Erstens verwende ich derzeit jeweils einen Thread pro Device, um die GPUs so ideal wie möglich zu versorgen. Wäre jetzt die CPU auch unter Volllast, würde die Performance wahrscheinlich unterm Strich schlechter ausfallen. Daher müsste einerseits der Scheduler mit mehreren OpenCL Contexts umgehen können, um mehrere Plattformen miteinander zu kombinieren, andererseits müsste per Fission-Extension die CPU in Subdevices aufgeteilt werden, damit nur spezielle Cores mit OpenCL beschäftigt sind, der Rest mit dem Scheduling der Rechenpakete. Das wäre eine sehr heikle Angelegenheit zur Konfiguration des Benchmarks und würde eher weniger Spaß machen. Der zweite Grund ist folglich, dass die CPU trotz all dem Aufwand kaum einen Geschwindigkeitsvorteil im Vergleich zu den GPUs bringen wird.

Vielleicht mach ichs trotzdem irgendwann mal. Speziell die Kombination AMD GPU und NVIDIA GPU (also mehrere OpenCL Plattformen) fände ich sexy. :)


mat schrieb am 23.02.2015 um 13:36

Bin gerade auf eine neue, sehr interessante Sache bei GPUPI 2.0 draufgekommen. Es ist der erste Benchmark, der jede einzelne Grafikkarte getrennt ans Maximum treiben kann. Wenn man also zB 3x GTX 980 drinnen hat, dann kann jede auf ihrer maximalen Taktfrequenz betrieben werden und den Benchmark damit deutlich beschleunigen:


mat schrieb am 23.02.2015 um 13:47

Btw, Kommentar von Massman auf HWBot, ob ihr System überhaupt die neuen Möglichkeiten von GPUPI 2.0 unterstützt:


Außerdem ist aktuell wieder die Rede, ob der Benchmark nun offiziell Weltrekordpunkte bekommt. Das wäre ... :eek:


Error404 schrieb am 23.02.2015 um 13:52

Naaa, da geht meine Freizeit! :D


mat schrieb am 23.02.2015 um 13:58

Geht eh recht flott. Der Benchmark wehrt sich gleich, wenn die Grafikkarten nicht stabil sind. Quad-SLI ist aber sicher trotzdem mühsam, speziell wenn sie unter flüssigem Stickstoff sind. Das würde ich mal gerne sehen, oder muss ich es selbst machen. :cool:


Error404 schrieb am 23.02.2015 um 14:13

Ja bitte Mat frier die 4 Karten selbst, dann bist sicher der Erste der einen Bench geschrieben hat UND Weltrekordhalter in einer Person ist! :eek:


Tequilaomega schrieb am 23.02.2015 um 15:21

Hab jetzt auch mal mit meinen 2 290x testen müssen. Unter 10 ging es leider nicht. Doch 10.1 aber alles Invalid. Letzte Stabile waren 10,4.

click to enlarge

Frag mich aber gerade ob ich was Falsch eingestellt habe das es Flotter als die 3 980er im letzten Screen von MAT war.


mat schrieb am 23.02.2015 um 15:43

AMD ist einfach deutlich besser in diesem Benchmark, daran gibt es nichts zu rütteln. :)

Wenn du jetzt noch mit Batch Size (zB 10M) herumspielst und vielleicht auch mal die Reduktion Sie höher stellst, werden die 10 Sekunden sicher fallen.

Obendrein kannst du noch die Karten einzeln übertakten. Eine der beiden schafft sicher mehr MHz!


Tequilaomega schrieb am 24.02.2015 um 21:12

Hab heute noch einmal probiert die Karten einzeln zu Übertakten und etwas mit den verschiedenen Reduction Size probiert.

Ist das so erlaubt ?

Karten Takten derweil auf 10Mhz gleich Hoch. Viel mehr geht unter Luft nicht bzw mag nicht da morgen alle Teile für den Wakü umbau kommen sollten.

Hab auf jedenfall hier die diese Werte erreicht.

20M / 64 = 10,028 Sek.
20M / 128 = 9,775 Sek.
20M / 256 = 9,751 Sek.

Hier noch die Screen

click to enlarge

click to enlarge

click to enlarge


mat schrieb am 24.02.2015 um 22:10

Schöner Score! :shake:

Das Anpassen der Parameter ist ein erlaubter Tweak und lastet im Prinzip nur deine Grafikkarten besser aus. :)


sichNix schrieb am 25.02.2015 um 19:19

gtx770 im werkszustand
click to enlarge

eine frage aus technischer richtung: ist der cuda test für die(meine) grafikkarte mehr belastung als der openCL test?
wenn der cuda test ~ bei 50% ist, hab ich die selbe temperatur auf der grafikkarte wie am ende vom openCL test, sie beginnt zu fiepen und die lüfter drehen höher.


mat schrieb am 25.02.2015 um 19:26

Interessante Beobachtung. Vielleicht hast du die Tests zu knapp hintereinander durchgeführt, sodass die Karte nicht mehr zurück zur Idle-Temperatur kehren konnte?

Ansonsten sollte der CUDA-Kernel (also die Berechnung) eine sehr ähnliche Last pro Core ergeben, auch wenn nicht 100% dieselbe. Unter Umständen ist dennoch die parallele Auslastung eine andere, weil CUDA wie im Screenshot ganz oben erkennbar eine genaue Angabe der Block- und Thread-Aufteilung zulässt und damit eine optimale Ausbeute der GPU zulässt. Bei OpenCL erfolgt dieser Teil automatisch über den Driver.


Tequilaomega schrieb am 26.02.2015 um 08:05

Wann geht Version 2 auf HwBot Online?


mat schrieb am 26.02.2015 um 08:33

Ich arbeite gerade an einer automatischen HWBot-Submission. Wenn das fertig ist, geht die Version offiziell online. Ich hoffe, dass das am Montag der Fall sein wird, kann es aber nicht versprechen.




overclockers.at v4.thecommunity
© all rights reserved by overclockers.at 2000-2025