"We are back" « oc.at

ZFS Checksum Error / Frage zur Analyse

creative2k 03.03.2025 - 13:55 73 0
Posts

creative2k

eigentlich mag ich nimmer
Avatar
Registered: Jul 2002
Location: Vienna
Posts: 8507
Hello Zusammen!

Ich hab schon ein bisschen gegoogelt aber noch nicht die richtige Antwort auf meine Frage/Case gefunden. Vielleicht hat ja wer im Forum mehr Knowledge dazu:

Folgendes "Problem":
Ich habe auf meinem Proxmox "Server" ein ZFS RaidZ1 über TrueNAS erstellt und ca. 54TB an Daten vom alten NAS auf das neue System kopiert.

Soweit so gut. Nach dem kopieren stand der erste Scrub an und es wurden auf allen Drives single Digit Checksum Errors ausgeworfen (1-9). Diese wurden anscheinend alle repariert, weil er mir nicht anzeigt, dass etwas nicht reparierbar ist. Ich habe den Scrub dann bei ca. 40% abgebrochen (er startete in der Nacht, in der früh hab ich die Fehler gesehen und wollte ihn zur Sicherheit stoppen, weil ich eine Theorie hatte).

Meine Theorie dazu, was am plausibelsten erscheint: Ich habe 4x48GB DDR5 5600 Crucial Rams ohne ECC verbaut. Dieser lief 1:1 ohne Teiler, d.h. enormer Stress am IMC der CPU. Ich schätze, dass dadurch diese Checksum Errors hergekommen sind.

Allerdings jetzt meine Fragen, um weiteren Vorgehen:
Ich habe den Ramteiler auf 1:2 gestellt und den Scrub neu gestartet. Bin aktuell bei 52% und habe aktuell 1 Checksum Error bei einer Platte.

Mein Verständnis wäre nun: Bis zum abschließen können noch weitere Checksum Errors auftreten, da ja mit der alten Ram Config die Daten geschrieben wurden, somit würde der Scrub noch die "alten" Fehler korrigieren.
-> Wenn diese Fehler korrigiert sein (Scrub completed), dürften, sofern der Ram das Problem war, diese Fehler ja nicht mehr auftreten, korrekt?

Ich hab schon am Anfang gewusst, dass das Ram Setup bissl heikel wird, daher hab ich die ersten Tage/Wochen jetzt ein Auge drauf.

###
Edit:

Scrub lief durch, auf allen Disks waren 1-2 Checksum Errors.

Ich hab die jetzt gecleared und teste die Woche weiter.
Hab mir aber auch nen Fabriksneuen HBA bestellt (Broadcom 9600 24i), ich vertraue dem gebrauchten nicht so ganz :p. Vllt kann ich den HBA dann mal ganz ausschließen als Fehlerquelle. Und ein Vorteil an den neuen kann ich noch NVMe's anschließen und brauch nur mehr 1 Kabel für alle 8 Platten :D.
Bearbeitet von creative2k am 03.03.2025, 19:44
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz