URL: https://www.overclockers.at/number-crunching/legends-never-die-gpupi_240993/page_3 - zur Vollversion wechseln!
Zu wenig Grafikspeicher auf deiner GT 630.Zitat von BooTesLäuft bei mir nur bei 1M und 32M, darüberCode:Selected device: GeForce GT 630 OpenCL 1.1 CUDA 6.5.19 is ready. Compiling OpenCL kernels ... done. Calculating 100.000.000nth digit of PI. 20 iterations. Allocated device memory : 671088640 Bytes Batch Size : 20M Reduction Size : 64 ERROR: OpenCL error: CL_MEM_OBJECT_ALLOCATION_FAILURE happened in file pi.cpp at line 553.
Code:Selected device: NVS 5100M OpenCL 1.1 CUDA 4.2.1 is ready. Compiling OpenCL kernels ERROR: OpenCL error: CL_INVALID_BINARY happened in file oclobject.cpp at line 628.
Edit:
Ok mat :-)
Hab die Batch Size auf 10M gesetzt, da kam die GT 630 so weit:
Code:Selected device: GeForce GT 630 OpenCL 1.1 CUDA 6.5.19 is ready. Compiling OpenCL kernels ... done. Calculating 1.000.000.000nth digit of PI. 20 iterations. Allocated device memory : 335544320 Bytes Batch Size : 10M Reduction Size : 64 00h 00m 00.521s Batch 1 finished. 00h 00m 09.558s Batch 2 finished. 00h 00m 18.475s Batch 3 finished. 00h 00m 35.323s Batch 4 finished. ERROR: OpenCL error: CL_OUT_OF_RESOURCES happened in file pi.cpp at line 628.
Ha, GTX 980 im PC, aber noch ein altes GPU-Z 0.6.4 installiert
Schön, dass es jetzt bei mehreren Leute funktinioniert.
Suderant!
bzgl. stevke:
offenbar ein bissl schwieriger mit den intel igps, denn die 7. generation (ivy klasse) kann zwar opencl 1.2, hatte aber zumindest zu beginn DP support nicht aktiv, wenn man dem hier glauben darf: http://milkyway.cs.rpi.edu/milkyway...ead.php?id=3195
vielleicht geht das ja mittlerweile zu verwenden?
Zitat von matstevke, deine GPU hat keinen Double Precision support.
Code:Double Precision Floating Point Supported Devices Intel® CPU Yes Intel® HD Graphics (GPU) No The CPU device implements cl_khr_fp64 to support for double precision floating-point. Double precision floating-point is a requirement for some scientific computing algorithms/applications.
Yay, erfolgreicher Durchlauf (mit Batch Size auf 1M):
Code:Selected device: GeForce GT 630 OpenCL 1.1 CUDA 6.5.19 is ready. Compiling OpenCL kernels ... done. Calculating 1.000.000.000nth digit of PI. 20 iterations. Allocated device memory : 33554432 Bytes Batch Size : 1M Reduction Size : 64 00h 00m 00.067s Batch 1 finished. 00h 00m 09.613s Batch 2 finished. 00h 00m 18.924s Batch 3 finished. 00h 00m 34.671s Batch 4 finished. 00h 01m 15.930s Batch 5 finished. 00h 01m 56.616s Batch 6 finished. 00h 02m 06.351s Batch 7 finished. 00h 02m 15.332s Batch 8 finished. 00h 02m 30.877s Batch 9 finished. 00h 03m 11.750s Batch 10 finished. 00h 03m 52.239s Batch 11 finished. 00h 04m 02.401s Batch 12 finished. 00h 04m 11.617s Batch 13 finished. 00h 04m 27.364s Batch 14 finished. 00h 05m 08.734s Batch 15 finished. 00h 05m 49.249s Batch 16 finished. 00h 05m 58.337s Batch 17 finished. 00h 06m 07.503s Batch 18 finished. 00h 06m 23.004s Batch 19 finished. 00h 07m 04.327s Batch 20 finished. 00h 07m 44.989s PI value output -> 5895585A0 GPU time for pi calculation: 454.011 s GPU time for memory reduction: 10.978 s
Wie wirkt sich batch size auf das Ergebnis aus?
Edit: skaliert super mit Takt und auch mit Speichertakt:
Win7 x64 hier, vcredist_arm.exe lässt sich nicht ausführen -> Keine gültige Win32 Anwendung.Zitat von Umlüxdu brauchst anscheinend die visual c++ 2013 redist x86 am 64bit OS. damit startets bei mir.
http://www.microsoft.com/en-us/down...n.aspx?id=40784
versuchs mal damit:
http://www.microsoft.com/en-us/down...s.aspx?id=40784
und dort die x86 und nicht die arm auswählen. das hat bei mir dann funktioniert.
Die Batch Size ist quasi die Problemgröße, mit der die Berechnung angegangen wird. Bei 1M werden 1.000.000 Teilberechnung von Pi gemacht und diese dann per Reduktion aufsummiert. Dann geht es weiter mit dem nächsten Batch. Die Summe aller Batches ist dann quasi das Endergebnis.
Übrigens sind die Batches, die während des Benchmarks angezeigt werden, nur Pseudo-Batches, um den Fortschritt besser zu zeigen. Es werden maximal 20 Zwischenschritte gezeigt, ein Pseudo-Batch besteht daher meistens aus mehreren Einzel-Batches mit der Problemgröße, die über Batch Size gewählt wurde.
hätte gerade so richtig bock auf eine LN2 Session
aber vor Dezember sicher keine Zeit
overclockers.at v4.thecommunity
© all rights reserved by overclockers.at 2000-2025