Maximale CPU-Leistung ohne Netzwerkparallelisierung
lordy 27.05.2009 - 11:19 1736 22
spunz
ElderElder
|
um 35k euro sollte sich eine sun fire x4600 schon ausgehen, die hätte bis zu 8x amd quadcore.
|
Viper780
ElderEr ist tot, Jim!
|
Falls ihr es nicht ohnehin schon tut koennte es womoeglich auch einiges bringen, mit ICC statt GCC (oder generell irgendeinem anderen Compiler) zu kompilieren. Wenn ihr eh schon so viel fuer Hardware budgetiert, sollte sich eine Lizenz (es sei denn, das findet eh im akad. Umfeld statt - da sollte die Lizenz iirc gratis sein) dafuer auch noch ausgehen. gromacs ist zum großen teil fortran code , ich würde da den Intel compiler nehmen - ist einer der den schnellsten code erzeugt um 35k euro sollte sich eine sun fire x4600 schon ausgehen, die hätte bis zu 8x amd quadcore. würd eher zu der Intel variante greifen, zB Sun Fire X4450 bzw den vorgeschlagenen HP mit Hexacore
|
spunz
ElderElder
|
würd eher zu der Intel variante greifen, zB Sun Fire X4450 und wieso? die gibts nur bis quad-quad und kosten dennoch +25k euro?
|
Viper780
ElderEr ist tot, Jim!
|
weil sie bei der Fließkommaarithmetik und oft auch beim Takt die Nase vorn haben.
Über 8-12 Cores flacht die skalierbarkeit doch stark ab (vorallem wegen der obengenannten FFT in der PME) und da ist es oft besser die singlecore performance auch zu steigern.
|
lordy
Bloody Newbie
|
traurig ist auch, dass das mit öffentlichen Mitteln finanziert wird: http://text.ots.at/meldung.php?k=OT...mp;bis=20090527
Hmm habs von der Theorie her immer so verstanden gehabt, dass Ewald überhaupt erst erlaubt die long range electrostatics überhaupt halbwegs unter Kontrolle zu bringen. Aber so wirklich tief hab ich mich da nie beschäftigt mit der Theorie - danke für den Tipp auf alle Fälle, werd ich ausprobieren...
|
Viper780
ElderEr ist tot, Jim!
|
ja auf einer einzelnen Maschine erlaubt es das, aber die Ewald summe macht nichts anderes als das Problem in den Inversen Raum zu bringen - so wie bei der Kristallographie. Also was vorher Unendlich war, wird jetzt zum delta Peak. Was vorher schmal war, wird jetzt breit (und wird raus gemittelt ![;)](/images/smilies/wink.gif) ). Somit kann man mit zwei FFT (von Real- in den Inversenraum und wieder zurück) das "unendliche" Problem der longrange (fast nur Coulomb) auf ein lokales beschränken. beim PME geht man sogar so weit das man das ganze in "Zellen" teilt und eine einfache Funktion drüber legt, die flott zu berechnen ist. Nur eine FFT braucht immens viel Kommunikation, (schau dir mal das "Schmetterlingsdiagramm" an) deshalb ist es besser die PME nur auf einem Rechner oder sogar nur auf 1-2 Cores rechnen zu lassen.
|
Maekloev
linux addicted
|
an der uni innsbruck findet am 25.06. ein potentiell interessantes kolloquium mit dem thema "MPI on a Million Processors - and Less" statt. vielleicht interessiert es jemanden von euch, der grad in der nähe ist. der dozent scheint schon was auf dem kasten zu haben. http://informatik.uibk.ac.at/aktuell/kolloquien.html.en
|
Viper780
ElderEr ist tot, Jim!
|
an der uni innsbruck findet am 25.06. ein potentiell interessantes kolloquium mit dem thema "MPI on a Million Processors - and Less" statt. vielleicht interessiert es jemanden von euch, der grad in der nähe ist. der dozent scheint schon was auf dem kasten zu haben.
http://informatik.uibk.ac.at/aktuell/kolloquien.html.en klingt interessant, komme da nur gerade aus London zurück und kan ned schon wieder weg
|