"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

RAID-5 hat sich soeben bewährt! Und wie...

GrandAdmiralThrawn 11.01.2003 - 20:29 1502 18
Posts

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3692
Also, es wird wieder Zeit für eine Geschichte aus meinem Katastrophenrepertoire!

Heute: Der Festplattenausfall! (Dieses Mal OHNE HighPoint 36x oder 37x!)

Also, ich war gerade für einige Stunden weg, als ich nach Hause in meinen SETI Bunker (= Mein bescheidener Wohnraum) komme, und ich wieder einmal von PC Speaker Geräuschen aus dem Primärrechner begrüßt werde, obwohl der Peltier nicht mehr am P4 steckt! ;) Dieses mal war es auch ein mir unbekanntes Geräusch, was einem sofort ein flaues Gefühl in den Magen treibt.

Ich sehe gar nicht lange nach was schuld ist, sondern fahre das System sofort herunter und reboote. VGA BIOS Post... System BIOS Post... IDE Controller 1 ok... Promise SuperTrak SX6000 Bios POST und RAID-5 Array im "Critical Status". Oh oh... Da hat wohl eine der WD1200JB Caviar Disks abgedankt? Fast! Die Platte geht noch, nur aus irgendeinem Grund crashte sie mitten im Betrieb.

Ich sollte dann nach dem Einloggen in die gesicherte SX6000 Software herausfinden, daß die Beeper als Signaltöne für die vollautomatische Arrayreparatur stehen. Ich versuchte währenddessen (die Reparatur läuft sofort ab dem SX6000 Post auch während des Bootens) ins Windows zu fahren, ohne große Hoffnung auf Erfolg, doch.. Es geht!?!??!

Seltsam genug, daß diese Platte einen vorübergehenden Ausfall hatte, jetzt schien das System auch noch zu funktionieren? Laufwerk I: (besagter Array) war sogar vorhanden!? Lese-Schreibzugriff möglich, nur etwa doppelt so lahm wie sonst!?

Dann dämmerte es mir. Die SX6000 Reparatur stell Daten auf Anfrage des Betriebsystems mit höherer Priorität als bei der Hintergrundreparatur wieder her! Der gesamte Array ist also auch trotz eines Festplattenausfalls mitten in der Reparaturphase voll benutzbar, und dazu müßte man das System nicht einmal rebooten!!! Der einzige Nachteil ist ein gewisser Geschwindigkeitsverlust. Folgender Screenshot wurde während der Reparatur angefertigt:

http://members.aon.at/grandadmiralt...s/tmp/raid5.gif

Selbst während ich diese Zeilen schreibe, ist die Reparatur in vollem Gange und ich höre einige mp3's von einem RAID Array, den es momentan eigentlich nicht mehr geben dürfte!

Fazit: Wie beim P4 / Peltier Unglück bin ich ein Mal mehr froh, zur teureren, professionelleren Hardware gegriffen zu haben! Selbst für relativ normale User mit etwas höheren Ansprüchen im Storage-Bereich zahlt sich RAID-5 bei großen Mengen kritischer Daten mehr als aus, vor allem im "schrottigen" IDE Sektor.

Kurz gefaßt: Der Promise SuperTrak SX6000 herrscht! ;) =)

Hier noch die mir zugesandten Warnmails des SX6000 Monitoring Serverdienstes:

Message from SuperTrak at NOVASTORM (novastorm), IP=<192.168.0.2>
01/11/03 19:32:54 Drive WDC WD1200JB-00CRA1 (0x00000001 ch 2) of Array Array1 (0x00000018) has Read Write Error ch2 LBA=9776b5f cmd=20 Disk Status= 80.

Message from SuperTrak at NOVASTORM (novastorm), IP=<192.168.0.2>
01/11/03 19:32:58 Array Array1 (0x00000018) has entered degraded mode.

Message from SuperTrak at NOVASTORM (novastorm), IP=<192.168.0.2>
01/11/03 19:32:56 Retry drive access in Array Array1 (0x00000018) Drive WDC WD1200JB-00CRA1 (0x00000001 ch 2).

Message from SuperTrak at NOVASTORM (novastorm), IP=<192.168.0.2>
01/11/03 19:55:49 Automatic rebuild begun by Engine on Drive WDC WD1200JB-00CRA1 (0x00000001 ch 2) of Array Array1 (0x00000018).



Array1 rebuilding 14%.....

Freeze

Here to stay
Registered: Sep 2001
Location: 127.0.0.1
Posts: 1916
NA!!

Fidel

Here to stay
Registered: Jul 2000
Location: Eisenstadt
Posts: 4519
n1 gat

is bei den scsi dingern auch so...

spunz

Super Moderator
Super Moderator
Avatar
Registered: Aug 2000
Location: achse des bösen
Posts: 11238
naja, der sinn des raid5 ist doch die ausfallsicherheit, was wundert dich jetzt daran? wirkliche datensicherheit ist raid5 eh nicht, hab ich auch ohne promise ;)

Spikx

My Little Pwny
Avatar
Registered: Jan 2002
Location: Scotland
Posts: 13504
meinen Glückwunsch ;)

SYSMATRIX

Legend
Legend
Registered: May 2000
Location: ~
Posts: 5020
Das is nunmal der Sinn des RAID5, so soll es funktionieren.

sehe daran nichts verweunderliches ...

Spikx

My Little Pwny
Avatar
Registered: Jan 2002
Location: Scotland
Posts: 13504
Zitat von SYSMATRIX
Das is nunmal der Sinn des RAID5, so soll es funktionieren.

sehe daran nichts verweunderliches ...
naja, er hat ja nicht geschrieben, dass es verwunderlich is... sondern er hat nur eine Geschichte aus seinem Leben erzählt ;)

SYSMATRIX

Legend
Legend
Registered: May 2000
Location: ~
Posts: 5020
Zitat von Spikx
naja, er hat ja nicht geschrieben, dass es verwunderlich is... sondern er hat nur eine Geschichte aus seinem Leben erzählt ;)

Dieser Satz:
Zitat von GrandAdmiralThrawn
Zitat von Spikx
naja, er hat ja nicht geschrieben, dass es verwunderlich is... sondern er hat nur eine Geschichte aus seinem Leben erzählt ;)
[/B]


+
Threadtitle haben in meinen Augen mehr nach Verwunderung ausgesehen. Stimmt schon: explizit steht in GTA's post nichts von Verwunderung.


Sieh dazu post von spunz.


Ist aber völlig belanglos, nur ein reply auf deinen sinnlosen Einwand... ";)"

Spikx

My Little Pwny
Avatar
Registered: Jan 2002
Location: Scotland
Posts: 13504
okay ;)

Wykat

Big d00d
Registered: Jul 2002
Location: Klosterneuburg
Posts: 349
vor das ich meine daten auf ein RAID5 systeem ubertragen haben, habe ich zuerst einige versuchen gemacht :p .

ich verwende jetzt ein software raid5 loesung und kann bestatigen das auch beim plattenausfall die daten immer noch da sind. (hatte im test systeem eine IBM platte die ausfiel bei zu hohe temperatur, war ideaal zum testen)

raid5 ist wirklich klasse, braucht aber keine eigene controller :D .

Wykat

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3692
Ok, ich bringe mal Licht in die Verwunderungsgeschichte! Daß die Daten in einem RAID-5 wiederhergestellt werden wenn eine Disk ausfällt war mir klar. Deshalb hab ich mir dieses sündteure System auch eingebaut.

Aber, daß ich mit dem Array während der Reparatur normal (nur verlangsamt) arbeiten kann, HAT mich sehr wohl verwundert! Das war mir so nicht ganz klar.

Ich hätte erwartet, daß ich den Rebuild im BIOS des Controllers abwarten muß. Daß momentan benötigte Daten bevorzugt rekonstruiert werden um damit weiterarbeiten zu können find ich schon extrem nützlich, macht natürlich vor allem für Fileserver Sinn, auch wenn das hier nur eine Workstation ist...

Edit: Hardware RAID-5 halte ich aber für sinnvoller, wegen dem Speed und der Auto-Reparatur die ja z.B. auch unter DOS oder während dem Bootvorgang weiterläuft. Vom optional großen Controllercache und der Möglichkeit ECC-Cache zu verwenden red ich erst gar nicht...
Bearbeitet von GrandAdmiralThrawn am 12.01.2003, 00:30

vEspertine

offline..
Registered: Sep 2000
Location: graz
Posts: 4753
hm. dh wenn von 4 platten eine ausfällt fängt er automatisch an, die daten auf den restlichen 3 wiederherzustellen? heisst das nicht auch, dass wenn du dann wieder eine vierte einbaust er wieder eine zeitlang nur mit eingeschränkter geschwindigkeit arbeiten kannst, weil der die daten dann wieder auf die vierte platte verteilt?? wär doch logischer, wenn das sys zuerst abfragt, obst mit 3 platten weiterarbeiten willst, oder die defekte gleich austauscht.. denk ich mir halt..

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3692
Das erweitern des RAID-5 Arrays dürfte wohl nur mit HotSwap Support funktionieren, dazu brauchst das Promise SuperSwap System. (Eigene Rahmen... kA wieso das so ned gehen soll, weil da auch a SX6000 drin is...)

Wenn Platte 4 komplett tot wäre (Meine WD geht ja wieder), dann könntest derweil lahm weiterarbeiten. Wennst die neue Platte einbaust, muß er die gesamte Rekonstruktion abschließen. Bis das fertig ist bleibt der Speed eingeschränkt, aber der SX6000 ist sowieso ned wirklich flott, nur eben halt sicherer.

So nebenbei...

Message from SuperTrak at NOVASTORM (novastorm), IP=<192.168.0.2>
01/11/03 23:48:38 Rebuild succesfully completed for Drive WDC WD1200JB-00CRA1 (0x00000001 ch 2) in Array Array1 (0x00000018).

*ruuuul*

EDIT: YEAH, die Software macht RECHTSCHREIBFEHLER!!! "succesfully"!! AWHWAUWHUAWHUAHW=Ü(EHB!"=(ENPÄID
Bearbeitet von GrandAdmiralThrawn am 12.01.2003, 00:31

vEspertine

offline..
Registered: Sep 2000
Location: graz
Posts: 4753
was hätt er gemacht, wenn die platte ganz ex wär? gewartet, oder automatisch alles auf 3 platten ausgelegt (also daten und parity verteilt)?

Binärmensch

Banned
Avatar
Registered: Dec 2001
Location: österreich / ni..
Posts: 724
raid rult einfach.. :D
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz