Garbage
AdministratorThe Wizard of Owls
|
Entweder ein Bug im Code oder der AMD OpenCL Treiber kann nicht zwischen GPU und CPU umschalten, wenn beide von AMD kommen. Aber gönnt mat mal eine Pause, er wird sich das sicher noch ansehen.
|
p1perAT
-
|
Bin jetzt auch endlich dazugekommen, leider bekomm ich jedesmal am Ende ein "Invalid result!" /Edit: Mit dem aktuellen NV Treiber funktionierts
Bearbeitet von p1perAT am 08.11.2014, 10:23
|
mat
AdministratorLegends never die
|
Heute/morgen kommt noch GPUPI 1.1. Folgende Features sind drinnen: - x64-Support, auch wenn es keine zusätzliche Performance bringt
- Zusätzliche Reduction und Batch Sizes
- Optimierungen für AMD-Grafikkarten, speziell bei der Memory Reduction
- Bessere GPU- und CPU-Auswahl
- Einige Bugfixes, dank euch
Mir ist auch schon aufgefallen, dass es mit älteren Treibern scheinbar Präzisionsprobleme bei der Berechnung gibt. Das Resultat passt dann nur zum Teil, es sind zB nur 4 Stellen statt den anpeilten 9 Stellen korrekt. Es passiert scheinbar nur mit älteren Treibern. Außerdem gibt es einen Bug mit der Batch Size "10M", die ebenfalls ein leicht anderes Ergebnis auswirft. Ich weiß noch nicht, was es genau ist, aber ich werde es fixen.
|
mat
AdministratorLegends never die
|
Hach, so viele Ergebnisse, auf deren Basis man arbeiten kann. Es ist echt herrlich!
|
sk/\r
i never asked for this
|
das freut den mat, dass wiedermal gebencht wird.
|
HVG
untitled
|
AMD Radeon HD 5850: 1B / 20M BS / 64 RS: 3m 08.509s (16.218s MR) AMD Radeon HD 5850: 1B / 20M BS / 256 RS: 3m 05.934s (13.658s MR) Intel Core i7 860: 1B / 20M BS / 64 RS: 3m 07.032s (14.763s MR) Intel Core i7 860: 1B / 20M BS / 256 RS: 3m 05.844s (13.683s MR) 512 RS geht leider nicht, noch die screenshots dazu:
|
Garbage
AdministratorThe Wizard of Owls
|
mein ex i7-860 lebt offenbar auch noch immer die cpu werte kannst aber kübeln, das ist ebenfalls die gpu. nehme mal an das wird mit mit v1.1 behoben werden.
|
HVG
untitled
|
weiss ich, das war ja nur fürs bugfixen für den wHm
|
Crash Override
BOfH
|
Unter der Tech Preview habe ich leider immer noch das Problem, das angeblich die exe nicht gefunden wird.
|
mat
AdministratorLegends never die
|
Es ist soweit: GPUPI Beta 1.1 - x64-Support, auch wenn es keine zusätzliche Performance bringt.
- Zusätzliche Batch Size mit 5M, die gute Reduction-Performance für AMD-GPUs liefert.
- Optimierungen für AMD-Grafikkarten, speziell bei der Memory Reduction!
- Bessere GPU- und CPU-Auswahl in allen verfügbaren Plattformversionen.
- Versionierung der Options - bei Nichtkompatibilität mit Vorgängerversionen wird die Datei nicht mehr geladen.
- Benötigt nun nur mehr 1/3 des GPU-Speichers.
- Etliche Bugfixes!
Bitte bitte bitte wieder fleißig testen! Besonderen Dank an Garbage für das exzessive Testing! Download: GPUPI Beta 1.1 (192 KB)[/preview]
|
InfiX
she/her
|
das wirkt schon vernünftiger danke mat aber weils mich interessiert, weisst du ca. worans lag? Selected device: Tahiti
OpenCL 1.2 AMD-APP (1573.4) is ready.
Compiling OpenCL kernels ... done.
Calculating 1.000.000.000nth digit of PI. 20 iterations.
Allocated device memory : 83888128 Bytes
Batch Size : 5M
Reduction Size : 64
00h 00m 00.079s Batch 1 finished.
00h 00m 01.521s Batch 2 finished.
00h 00m 02.990s Batch 3 finished.
00h 00m 05.163s Batch 4 finished.
00h 00m 09.538s Batch 5 finished.
00h 00m 13.640s Batch 6 finished.
00h 00m 15.083s Batch 7 finished.
00h 00m 16.548s Batch 8 finished.
00h 00m 18.703s Batch 9 finished.
00h 00m 22.987s Batch 10 finished.
00h 00m 27.007s Batch 11 finished.
00h 00m 28.450s Batch 12 finished.
00h 00m 29.912s Batch 13 finished.
00h 00m 32.164s Batch 14 finished.
00h 00m 36.978s Batch 15 finished.
00h 00m 41.462s Batch 16 finished.
00h 00m 43.116s Batch 17 finished.
00h 00m 44.929s Batch 18 finished.
00h 00m 47.546s Batch 19 finished.
00h 00m 52.076s Batch 20 finished.
00h 00m 56.088s PI value output -> 5895585A0
GPU time for pi calculation: 55.162 s
GPU time for memory reduction: 0.925 s
Selected device: Tahiti
OpenCL 1.2 AMD-APP (1573.4) is ready.
Compiling OpenCL kernels ... done.
Calculating 1.000.000.000nth digit of PI. 20 iterations.
Allocated device memory : 335546368 Bytes
Batch Size : 20M
Reduction Size : 64
00h 00m 00.287s Batch 1 finished.
00h 00m 01.735s Batch 2 finished.
00h 00m 03.193s Batch 3 finished.
00h 00m 05.590s Batch 4 finished.
00h 00m 09.997s Batch 5 finished.
00h 00m 13.888s Batch 6 finished.
00h 00m 15.336s Batch 7 finished.
00h 00m 16.793s Batch 8 finished.
00h 00m 19.166s Batch 9 finished.
00h 00m 23.490s Batch 10 finished.
00h 00m 27.307s Batch 11 finished.
00h 00m 28.749s Batch 12 finished.
00h 00m 30.211s Batch 13 finished.
00h 00m 32.608s Batch 14 finished.
00h 00m 37.015s Batch 15 finished.
00h 00m 40.905s Batch 16 finished.
00h 00m 42.347s Batch 17 finished.
00h 00m 43.808s Batch 18 finished.
00h 00m 46.182s Batch 19 finished.
00h 00m 50.503s Batch 20 finished.
00h 00m 54.171s PI value output -> 5895585A0
GPU time for pi calculation: 53.628 s
GPU time for memory reduction: 0.543 s
e: nur hoffentlich sind jetzt nicht die ganzen 7950er _noch_ schneller
Bearbeitet von InfiX am 08.11.2014, 17:56
|
tinker
SQUEAK
|
Habs auch grad zweimal mit der x64er durchlaufen lassen. Mit 5M und 10M batch size und bekomm in beiden Fällen wieder die Invalid Result Meldung. Aber das is denk ich eh ein Bug der schon bekannt ist, oder?
|
Römi
Hausmeister
|
Default settings, und graka ohne oc: (ivy i7 @ 4.2, graka ist eine Gigabyte Ghz edition)
Bearbeitet von Römi am 08.11.2014, 18:16
|
s!LeNt_tR!ggEr
4 Sterne "Inhaber"
|
Next run 20m (1100/1350): Extra mal 5 und 10m getestet: 5m: 10m: Keine Fehler bei mir. Gebencht mit der x64.exe
Bearbeitet von s!LeNt_tR!ggEr am 08.11.2014, 18:28
|
HVG
untitled
|
AMD Radeon HD 5850: 1B / 20M BS / 64 RS: 3m 08.509s (16.218s MR) AMD Radeon HD 5850: 1B / 20M BS / 256 RS: 3m 05.934s (13.658s MR)
Intel Core i7 860: 1B / 20M BS / 64 RS: 3m 07.032s (14.763s MR) Intel Core i7 860: 1B / 20M BS / 256 RS: 3m 05.844s (13.683s MR) mit der neuen 64bit version: AMD Radeon HD 5850: 1B / 20M BS / 64 RS: 2m 11.073s (0.758s MR) AMD Radeon HD 5850: 1B / 20M BS / 256 RS: 2m 10.981s (0.699s MR) Intel Core i7 860: 1B / 20M BS / 64 RS: 2m 11.062s (0.757s MR) Intel Core i7 860: 1B / 20M BS / 256 RS: 2m 10.982s (0.701s MR) wenn ich btw den fehler "Error: CL_OUT_OF_RESOURCES" bei 512 MR krieg kann ich danach nix mehr machen - calculate is ausgegraut und stop tut nix. edit: rein interessehalber hab ich nochmal mit 16 RS laufen lassen: AMD Radeon HD 5850: 1B / 20M BS / 16 RS: 2m 18.584s (8.284s MR) und dann noch mit der non-64bit version den standarddurchlauf: AMD Radeon HD 5850: 1B / 20M BS / 64 RS: 2m 11.049s (0.755s MR)
Bearbeitet von HVG am 08.11.2014, 18:32
|