Es war schon längst wieder Zeit für ein Update unseres Benchmarks! GPUPI 2.3 bringt einige neue Features, die das Benchen der Kreiszahl Pi noch komfortabler machen. Besonders stolz sind wir allerdings auf die Unterstützung von
CUDA 8.0 inklusive Optimierungen, die künftig NVIDIA-Grafikkarten Beine macht. Damit ist die Berechnung über CUDA erstmals schneller als die OpenCL-Implementierung und das gilt nicht nur für neue Pascal-GPUs! Aber das ist noch lange nicht alles.
Downloads: GPUPI 2.3.4 (1.22 MB, CRC-32: 88BE77A2) |
GPUPI 2.3.4 - Legacy Version (
nur für Windows XP/GeForce 200 Grafikkarten!, 626 KB, CRC-32: 5717B079)
Das Update ist übrigens
nicht verpflichtend, die GPUPI-Versionen 2.1 und 2.2 sind weiterhin für HWBOT gültig. Allerdings ergibt es nur wenig Sinn, nicht auf den neuesten Build umzusteigen. Überzeugt euch selbst, hier die Features von GPUPI 2.3 im Detail:
Unterstützung von CUDA 8.0Für CUDA 8.0 ist zwar erst ein Release Candidate erschienen, aber das kümmert uns wenig. Das SDK ist bereits stabil und so konnten wir problemlos das neue CUDA in den Benchmark einbauen. Mit den verbesserten Profiling-Tools des SDKs haben wir einige Bottlenecks in der Berechnung ausfindig gemacht und selbstverständlich eliminiert. Damit ist die Berechnung mit CUDA in der Kategorie 1B nun ungefähr
1,3 Sekunden schneller als mit OpenCL auf einer GTX 1080. Endlich machen sich die Vorteile von CUDA bezahlt, auch wenn es prinzipiell nicht überraschend kommt: NVIDIA stellt mit CUDA die bessere Infrastruktur bereit, von Debugging Tools bis zum Profiling ist alles vorhanden, was guter Code braucht. Es werden auf regelmäßiger Basis neue Versionen des SDKs veröffentlicht, dazu gibt es zahlreiche Bloginhalte für Tipps zu Optimierung usw. Außerdem bekommen wir die Möglichkeit, die neu erschienenen Grafikkarten selbst zu testen - auch das hilft mehr, als man es glauben mag.
Ein Dankeschön an diesem Punkt an
NVIDIA Deutschland für das Bereitstellen eines Testmusters!
GPUPI läuft nun auf CUDA 8.0 und gibt damit der GTX 1080 einen ordentlichen Anschub Dass auch ältere NVIDIA-Grafikkarten von den Optimierungen profitieren, zeigen unsere Tests mit der GTX 750 Ti:
Auch die GTX 750 Ti von den Optimierungen: Links GPUPI 2.3 mit CUDA, mittig GPUPI 2.2 mit CUDA, rechts GPUPI 2.3 mit OpenCL DPI Awareness ... also 4K readyGPUPI ist ein moderner Benchmark, also sollte er auch so aussehen. Der Benchmark unterstützt ab sofort DPI Awareness und skaliert entsprechend wenn der Windows Desktop auf Wunsch größer dargestellt wird. Speziell die Schärfe der Schrift hat sich dadurch stark verbessert:
Am Beispiel einer Skalierung von 150%: Links GPUPI 2.3 mit schärferen Schriften, rechts 2.2, das von Windows automatisch hochskaliert wird Danke an ASUS Österreich/Deutschland für die Bereitstellung eines 4K-Monitors.
Validierung von ZwischenergebnissenEin Durchlauf von GPUPI kann speziell auf älterer oder schwächerer Hardware eine Weile brauchen. Selbst wenn das System instabil war, erfolgte erst nach dem letzten Loop die Validierung des Ergebnisses. Das ändert sich hiermit: Insgesamt
fünf Mal wird das Ergebnis nun dazwischen überprüft, damit man nicht unnötig lange auf einen ungültigen Durchlauf warten muss. Die zusätzliche Validierung ist so optimiert, dass sie sich nicht auf die Performance auswirkt.
Die Ergebnisvalidierung erfolgt nun auch während des Durchlaufs Validierung von ErgebnisdateienDas ist eher ein Feature für Pro-Overclocker, die ständig mit Ergebnissen jonglieren. Zum Beispiel ist bei Contests oder Weltrekorden ein Backup-Score, der nicht sofort an HWBOT übermittelt wird, durchaus üblich (man nennt das Sandbagging). Diese sogenannten "Result files" können nun auf Nummer Sicher nach dem Abspeichern zusätzlich validiert werden. Dabei wird einerseits das Dateiformat inklusive erfolgreicher Ver- und Entschlüsselung überprüft, andererseits sieht man auch das Ergebnis selbst, die erkannte Hardware und weitere Daten, die später an HWBOT übermittelt werden.
Bugfixes und kleinere Verbesserungen- Berechnung auf mehr als acht Devices - rein technisch könnte man nun auch tausende Grafikkarten durch GPUPI jagen!
- Unterstützung für NVIDIAs Tesla-Grafikkarten
- Verbesserungen an der Ausgabe (theoretische Occupancy bei CUDA, Speicherverbrauch in MB statt Bytes)
- Korrekte Erkennung von RX 480-Grafikkarten
- Die Legacy-Version für Windows XP ist nun auch mit Visual Studio 2013 Update 5 kompiliert worden und hat dadurch erfreulicherweise nun dieselben Abhängigkeiten wie die normale GPUPI-Version.
- Aufräumarbeiten für einen sauberen Quellcode
Bekannte Bugs- Die Legacy-Version macht keine korrekten Screenshots in Auflösungen größer als WQHD. Das liegt daran, dass die XP-fähigen Bibliotheken das nicht können. Da diese Variante des Benchmarks ohnehin nur für Windows XP und GeForce 200 Grafikkarten verwendet werden sollte, die obendrein keine derart hohen Auflösungen beherrschen, wird dieser Fehler nicht behoben.
» Beitrag diskutieren (22 Kommentare)