chriswahl
Addicted
|
Schönen Abend,
So, Christian ist sowas vom Arbeitsrechner genervt - Weil ich muss Berechnungen fertig machen, aber die killt den Rechner sehr Random.
Also, seit knapp 2 Wochen habe ich den BSOD mit MEMORY_MANAGEMENT - den habe ich vorher nicht gehabt.
Welches Sys:
Ryzen 2700x - x470 Mainboard - 48 GB (2x8 und 2x16) Corsair 3200er RAM - 3 SSDs (Samsung 960 Evo (512 GB), 950 Evo (512 GB) und 980 (Pro? - 2 TB))
Der Rechner lief eigentlich jetzt seit 2018 ohne Probleme, oft auch 2, 3 Wochen durchgehend. Auch wenn ich ihn anständig belastet habe, ist nichts passiert. Ich verwende für meine Arbeit ein Selbstgeschriebenes Matlab-Programm, das auch sehr stark Speicherintensiv werden kann. Daher habe ich auf der 950 Evo 450 GB Virtueller Speicher (fixed von der Größe), auf der 980 mindestens 1,1 TB. Aber viel mehr als 600, 700 MB Auslagerungsspeicher habe ich selten gebraucht, erst vor knapp 2 Wochen habe ich dann ein "Out of Memory" bekommen, d.h. ich musste den Speicher auf 1,9 TB fixieren. Und seitdem kann ich nichts größeres mehr fertig berechnen.
BSOD bekomme ich sehr Random, bei kleinen (150 bis 200 GB Auslagerungsspeicher) läuft alles tadellos, bei 400, 500 GB kanns mal 2 Stunden gut gehen, mal sinds auch 16 Stunden. Jedenfalls werden die Berechnungen so nicht fertig, die sollten eigentlich so 1 bis 2 Wochen durchlaufen.
Was wurde probiert? * AMD Clean Driver Install (Chipset und Grafiktreiber) * RAM auf 2400 CL18 fixiert (die ersten 4 Primärtimings auf 18, den Rest auf auto), Vdimm = 1,35V * Prozessor auf 3,7 GHz fixiert (Kühlungstechnisches Problem hatte ich vorher auch keines) * Virtueller Speicher reduziert (auf 1,5 GB wie vorher) * Virtueller Speicher auf 950 Evo ausgeschalten * Virtueller Speicher auf 980 von der Größe her fixiert * Samsung SSD SW sagt, dass alles gut ist
Was wurde nicht probiert? * Memtest (geht erst nächste Woche wieder)
Irgendwer eine Ideen, warum zum Teufel auf einmal aus dem nichts diese Probleme angefangen haben? Vermutlich der RAM, oder? Aber aus dem nichts?
Gut, bitte hilft mir, ansonsten landet dir vom 3. Stock auf dem Asphalt ("Du Chef, da ist was passiert....").
Danke und Grüße Christian
|
xtrm
social assassin
|
Du hast ja drei SSDs drin - hast du probiert, es nur mit einer zu versuchen? Zudem würde ich den statischen virtuellen Speicher generell sein lassen, Windows sollte das mittlerweile selbst hinbekommen. Und was steht in der Windows Ereignisanzeige? Dort sollte eigentlich drinnen stehen, auf welche Hardware es sich bezieht (zumindest per ID, etc.). Es gibt auch das freie Programm "Blue Screen View", mit dem sich da ein paar weitere Infos auslesen lassen.
Abgesehen davon, ja, Memtest halt.
|
Dune
Dark mode
|
Um was für Software bzw für eine Berechnung geht es überhaupt? Hast du da irgendwelche Log Files oder detaillierten Beschreibungen warum es dich schießt?
Nicht dass das per se hilft, aber es ist ein Anhaltspunkt. Habe selber seit gut 10j mit Numerik, HPC, Cloudcomputing zu tun, die Zusammenhänge sind da sehr mühsam. Aber verstehe noch nicht so ganz wo der Hut wirklich brennt.
|
daisho
SHODAN
|
1) SSDs auf Fehler testen 2) RAM via MemTest86 testen
|
smashIt
master of disaster
|
hab hier auch einen rechner mit dem selben problem. üblicherweise passiert es wenn die kiste aus dem standby kommt. und nachdem windows beim herunterfahren tatsächlich in den standby geht kommt das oft vor.
kiste ist aber ein thinkpad mit intel-cpu und nvidia gpu. allso keine überschneidung mit deiner hardware.
mein verdacht ist derzeit irgendwas mit dem sata-treiber. wie eine sandisk-ssd verbaut war, crashte die kiste innerhalb einer minute nach dem aufwachen aus dem standby. mit einer samsung ssd ist es eher sporadisch. nach einem reboot kann man aber normalerweise den ganzen tag durcharbeiten.
|
Dune
Dark mode
|
Habt's ihr alle AMD Systeme? Mir ist das noch nie untergekommen tbh
|
RIDDLER
Dual CPU-Fetischist
|
Bei mir kam dieser Fehler bei meinem System unter, als ich mit dem RAM Training bei Ryzen 7000 experimentiert habe. Es waren die Timings zu scharf, obwohl ich sie auf die Werte festgelegt hatte, welche auch das Training selbst verwendet hat. Ich sehe aber, dass du deine RAM-Timings/Geschwindigkeit schon auf Default bzw. konservativ gesetzt hast.
Weitere Punkte welche man noch prüfen könnte: * Sitzen die RAM-Sticks ordentlich? * Sitzt die CPU ordentlich?
|
chriswahl
Addicted
|
Guten Morgen. Danke mal für die Rückantworten. Ich sitze jetzt in der Arbeit und mache gerade den memtest. Und siehe da, im ersten Run bereits 84 Fehler. Was mich aber wundert ist, das es a) vor zwei Wochen plötzlich angefangen hat und b) ansonsten nichts davon merke, auch wenn ich kleinere Berechnungen mache oder einfach nur arbeite. Also wirklich nur dann, wenn ich große Berechnungen mache.
Ich verwende Matlab und bei Programmausführung wird geschaut, wieviel RAM da ist. Matlab kann NICHT mit dynamischen Auslagerungsspeicher umgehen, daher fixed. Nein, Protokoll innerhalb Matlab gibt's keine und die Ereignissanzeige hilft auch nicht. Der einzige sinnvolle Hinweis war der BSOD, aber das hilft halt auch nicht wenn man nicht davor ist.
Ich werde jetzt Mal die 16 GB RAM rausnehmen und schauen was passiert. Arbeiten muss i ja auch nochwas.
|
xtrm
social assassin
|
Der einzige sinnvolle Hinweis war der BSOD, aber das hilft halt auch nicht wenn man nicht davor ist Ich wiederhole: Das Programm Blue Screen View nutzen.
|
chriswahl
Addicted
|
Alles klar, die letzten 5 Dumps habe ich da.
4 mal ist es: ntoskrnl.exe+55dc4d + BugCheckCode 0x0000001a
und beim letzten Mal (da war der Rechner im Idle am Wochenende)
ntoskrnl.exe+4b944a + PSHED.dll+15b0 + BugCheckCode 0x00000124
|
daisho
SHODAN
|
Wenn der MemTest Fehler wirft ist es recht eindeutig. Windows ist da recht schmerzbefreit was RAM-Fehler angeht (was eigentlich blöd ist weil es halt dann wohl gerne mal fehlerhafte Daten schreibt), merkt man dann meist nur zufällig eben durch (Programm)Abstürze.
RAM und Disk sind halt Dinge die gerne mal kaputt werden mit der Zeit, CPU und Mainboard eher selten.
|
xtrm
social assassin
|
Den 124er kenne ich, den hab ich auch alle heiligen Zeiten einmal. Bei mir bin ich der Meinung, dass es mit einem USB3 Port zusammenhängt.
|
chriswahl
Addicted
|
So, dann melde ich mich retour. Danke nochmals für die Rückmeldungen. Die 32 GB RAM (es waren doch g.skill... hatte ich ganz vergessen) habe ich ausgebaut.
16 GB RAM auf ryzen 2700x mit 3200CL16 -> ohne Probleme.
Die anderen RAM habe ich mit nach Hause genommen (sind eh meine privaten) und
32 GB auf Ryzen 1700 mit 2933CL16 (mehr geht dem Mem Controller nicht) -> ohne Probleme.
Ursache? Entweder ist ein Riegel plötzlich locker geworden oder eine plötzliche Inkompatibilität. Ich werde dann die ursprünglichen zweiten 16 GB wieder einbauen, wenn die Berechnung fertig ist (so in einer Woche?).
Berechnung läuft seit knapp 24 Stunden. 1,1 TB virtueller Speicher verwendet, 1,26 TB noch verfügbar.
Zusatzfrage: Kann man eigentlich RAM-Speicher einem spezifischen Programm zuweisen? Es ist nämlich etwas zäh, am Rechner daneben zu arbeiten.
|
Römi
Hausmeister
|
Beim Ryzen 1600 musste ich zb den Speichertakt stark zurücknehmen um 4 sticks zum laufen zu bringen. Ka wie es beim 2700x ist, eventuell etwas zum im Auge behalten wenn die Speicherfehler nicht weggehn, evt mal nachlesen was supported ist. Wäre aber auch seltsam für plötzliches Auftreten. @Ram zuweisen: ich kenn das üblicherweise nur wenn es bei Programmen selbst die option dafür gibt (datenbanken, Java zb). Im Win selbst wüsste ich nichts - prozess priorität hat vielleicht einen Einfluss. Edit: Außerdem, wenn du den Speicher einschränkst dann wird auch nur bis zu dem limit verwendet und auch nichts ausgelagert. Einer VM könntest du den Ram zuweisen und Laufwerke entsprechend fürs swapfile. Sicher etwas langsamer insgesamt, aber nebenbei arbeiten sollte so gut gehen. Zum Blue Screen View - Ja ist ok, aber alle infos zeigt der nicht an. Also Windbg ersetzt das nicht. Das gibts jetzt übrigens auch als store app soweit ich weiß. Wenn du willst kannst mir auch mal einen dump schicken oder wo raufladen - debuggen kann ichs nicht, aber zumindest die basics anschaun. Wenn Speicherfehler nachgewiesen sind dann ist das aber eh recht egal. Zum Setup - ich denke du weiß was du da tust - aber Swap ist halt nie leiwand. Schade dass ihr dafür keinen Server oder Workstation habt mit ordentlich Ram. Oder zumidnest einen dedizierten PC. Vielleicht wären ein paar optane drives auch eine option das zu beschleunigen, die großen sind aber sehr teuer, also wohl eher nicht Ist halt echt bitter wenn das wochen rennt und dann crasht es auch noch.
Bearbeitet von Römi am 15.12.2023, 09:15
|