Nvidia PhysX - CPU-Benachteiligung belegt?
Denne 08.07.2010 - 13:09 1096 8
Denne
Here to stay
|
PhysX ist auf Nvidias Geforce-Grafikkarten deutlich schneller als auf Prozessoren. Eine neue Analyse zieht den Schluss, dass dies auch am Programmcode für die CPU-Version liegt. Auf gamestar.de steht der Artikel von realworldtech.com kurz zusammen gefasst. Ob es wirklich der Tatsache entspricht? Wenns jedoch stimmt (was mich nicht wundern würde), fände ich es arg, obwohl auch nachvollziehbar aus nVidia's Sicht. Falls es diesbezüglich schon einen Thread gibt, bitte einfach löschen, hab jedoch auf die Schnelle keinen gefunden.
|
deleted060824
|
Auf techreport stand gestern ähnliches. SSE soll ca. 1.5-2x schneller sein als x87 und da derzeit nur ein Kern für Physics genutzt wird, kann man sich leicht ausrechnen, was auf einem 4-Kerner + richtiger Optimierung möglich wäre. Nvidias wird sich aber ihr derzeit wichtigstes Argument, neben der schnelleren Tesselation, gegen ATI`s 5***er Serie nicht durch irgendwelche Optimierungen selbst zerstören.
|
Nico
former person of interest
|
warum solltens auch den code für die cpu optimieren wenn sie am liebsten ne seperate gpu dafür im einsatz sehen
|
COLOSSUS
AdministratorGNUltra
|
Ich hab die Primaerquelle nicht angezapft, aber zumindest "(and frankly supporting SSE is easier than x87 anyway)" ist Bogus - beides ist lediglich ein Compiler-Flag (-mpfmath= bei GCC z. B.), auszer der Code ist wirklich Hand-Written Assembly. Was mich wundern wuerde, wenn NVIDIA nicht viel dran liegt, dass das ganze auf einer x86-CPU flott zu Werke geht
|
Hornet331
See you Space Cowboy
|
Deshalb war und bin ich nie ein freund von physx gewesen, die eigentliche novodex engien war für die damalige zeit wirklich gut aber wie aegia entschieden hat es in physx umzubennen um damit hardware zu verkaufen, wars aus...
|
mat
AdministratorLegends never die
|
Ich hab die Primaerquelle nicht angezapft, aber zumindest "(and frankly supporting SSE is easier than x87 anyway)" ist Bogus - beides ist lediglich ein Compiler-Flag (-mpfmath= bei GCC z. B.), auszer der Code ist wirklich Hand-Written Assembly. Was mich wundern wuerde, wenn NVIDIA nicht viel dran liegt, dass das ganze auf einer x86-CPU flott zu Werke geht Ich weiß nicht welcher und wie viel Code automatisch mit diesen Instruktionen kompiliert werden kann, aber eine ordentliche Umsetzung/Parallelisierung durch SSE setzt einige konzeptionelle Entscheidungen voraus, genauso wie zusätzlichen Code, um die neuen Register zu nutzen. Als schnelles Beispiel hab ich hier ein MatrixMultiply() gefunden.
|
Starsky
Erbeeren für alle!
|
warum solltens auch den code für die cpu optimieren wenn sie am liebsten ne seperate gpu dafür im einsatz sehen signed. wenn ich mein produkt verkaufen möchte, dann wäre ich blöd wenn physx auf cpus gleich/besser performen würde.
|
COLOSSUS
AdministratorGNUltra
|
Das stimmt natuerlich, wenn man die SIMD-Einheiten moderner CPUs so gut es geht nutzen moechte.
Einen wirklich gut optimierenden Compiler vorausgesetzt wird man aber auch ohne manuelles Trimmen auf optimalen Ablauf unter Nutzung von SSE, AltiVec et al. nur durch entsprechendes Uebersetzen einen durchaus messbaren Unterschied erzielen koennen. ICC z. B. hat ja eine ziemlich gute Auto-Vectorization, was man so liest.
|
Hornet331
See you Space Cowboy
|
ICC z. B. hat ja eine ziemlich gute Auto-Vectorization, was man so liest. Na hoffentlich, die milliarden die intel in seinen compiler investiert sollten sich auch irgendwie auszahlen.
|