"We are back" « oc.at

REQ: Hochverfügbarkeitslösung ohne Admin-Eingriff

LandeX 29.01.2009 - 17:57 1186 19
Posts

LandeX

Little Overclocker
Registered: Nov 2003
Location: SBG / AT
Posts: 65
Hi Leute !
Hoffentlich bin ich im richtigen Bereich mit meinem REQ :D
Heute geht's bei mir um eine Art Hochverfügbarkeitslösung, deswegen schreib ich die Anforderung und Hardwarekonzeption jetzt einfach mal mit rein. Vielleicht können die Leute die sowas schon konzeptioniert haben mir ein paar Tips geben.

Konkret geht es darum ein System zu schaffen, bei dem der Benutzer gegen PC Ausfall und Datenverlust geschützt ist (im Prinzip Case PC tot und Platte tot) und das ganze mit so wenig Benutzereingriff wie möglich. Dem Benutzer muss es auch um 02:00,ohne große Hard- und Softwareeingriffe, möglich sein sein System wieder Lauffähig zu bekommen.
Es wird sich übrigens um Windows XP SP3 handeln beim OS.

Hardwarekonzept:

* 2 x identischer Rechner (HP Workstation wirds vermutlich werden oder was mit anständigem 24h vor Ort Service)
* 2 x HotPlug fähiger RAID Controller
* 2 x identische HDD (Raptor für 24/7)
* 2 x Wechselrahmen (dazu unten mehr)

Konzept zur Sicherung / Wiedeherstellung:

Zu einer gewissen Zeit (Leerlaufzeit zwischen Betrieb und Pause / Ende) wird via Acronis Workstation (Echo Mode) ein genaues Abbild der Systemplatte auf die HDD im Wechselrahmen geschrieben. Danach wird die geklonte HDD entfernt und sicher verwahrt. Deswegen auch der HotPlug fähige RAID Controller. Ich will den Controller nicht im RAID Mode nutzen, nur HotPlug ist wichtig damit kein Reboot oder großer Benutzereingriff notwendig ist.

Szenario1: Der PC ist tot, eine der Komponenten ist defekt. Der Benutzer holt sich seinen Ersatzrechner und scheibt die funktionierende Platte rein und kann weiterarbeiten.

Szenario2: Die Festplatte ist defekt. Der Benutzer schnappt sich die geklonte HDD, entfernt die defekte HDD aus dem Rahmen und schiebt die funktionierende rein.

Szenario3: Alles defekt - Pech gehabt, bzw. sollte immer noch ein zweiter, funktionierender PC vorhanden sein und eine intakte Platte.

Den Prozess mit dem Sichern auf zweite HDD, inklusive Erkennung sobald die zweite Platte im System steckt werde ich mit Windows Scripts lösen.

Würde mich freuen eure Anregungen bzw. Ideen dazu zu hören - insbesondere zum Thema RAID Controller. Ich muss mich drauf verlassen können das HotPlug anständig funktioniert, bzw. die Software des RAID Controllers anständig funktioniert und Fehler meldet. Da hab ich insbesondere bei gängigen Controllern in der Vergangenheit großteils schlechte Erfahrungen gemacht. Wayne, hauptsache meine Serverchen haben feine Controller :D

Thx 4 comments and ideas.
Bearbeitet von LandeX am 29.01.2009, 18:04

BiOs

Here to stay
Avatar
Registered: Feb 2001
Location: 7400
Posts: 2920
das hört sich nach viel zu viel aufwand für den user an.
ich würds so machen:

- einen whs server im (gbit)lan, disks im raid-0
- am client einstellen das sämtliche userdaten am whs liegen

ja das wars eigentlich schon. sollte der rechner ex gehen liegen eh alle relevanten daten am whs, und mit der wiederherstellungscd hast du einen neuen client in xx* min wieder am laufen, einfach cd rein und warten ;)

* abhängig davon wieviele daten dann übers netzwerk vom whs auf den client geschaufelt werden. bei einem normalen system sinds ca. 15min.

LandeX

Little Overclocker
Registered: Nov 2003
Location: SBG / AT
Posts: 65
Es geht ja nicht nur um die Userdaten, sondern auch um sämtliche Applikationen des Users (Diverse Software, auch mit Nutzung von COMx und USBx).

Lässt sich das mit Homeserver lösen ?

BiOs

Here to stay
Avatar
Registered: Feb 2001
Location: 7400
Posts: 2920
soweit ich das sagen kann -> ja
habe selber seit ca. eineinhalb jahren einen homeserver am laufen und schon diverse rechner damit wiederhergestellt (die meisten testweise ;) ), hat immer problemlos geklappt. applikationen, einstellungen, etc werden natürlich mitgebackupt.

edit:
danke few, ich mein natürlich ein raid1!
Bearbeitet von BiOs am 29.01.2009, 21:53

FrankEdwinWrigh

stuck on the outside
Avatar
Registered: Nov 2002
Location: im 21. Jhdt.
Posts: 2507
und was macht ihr dann wenn der homeserver eingeht ? mit raid 0 noch dazu :fresserettich:

finde die idee mit zwei identen rechnern eigentlich gut. eventuell in beide ein raid1 .. da die platte wohl das gefährdetste teil ist.

funktionieren tut da jede billige onboard lösung in ibm/lenovo workstations.
nur wegen dem hotplug solltest du dich umstehen ..
der strom ist da ja in vielen fällen ein mechanisches problem ..
dass es bei einem normalen stecker gern den rechner putzt, wenn du ansteckst.
dazu gibts aber sicher entsprechende schächte mit backplanes nachzukaufen.

sata ist ja so oder so hotplug

was dir noch fehlt ist eine schnöde datensicherung .. wenn was gelöscht wird, oder eine woche später auffällt dass file xyz weg ists.
mit dem bisherigen system würdest du den datenverlust ja sofort wieder synchronisieren

Mfg fEW

Polyfire

Addicted
Avatar
Registered: Feb 2007
Location: .
Posts: 415
Zitat von LandeX
Zu einer gewissen Zeit (Leerlaufzeit zwischen Betrieb und Pause / Ende) wird via Acronis Workstation (Echo Mode) ein genaues Abbild der Systemplatte auf die HDD im Wechselrahmen geschrieben.

Was ist wenn die Sysplatte genau zu dem Zeitpunkt verreckt?
Imho musst da mehrere Platten einplanen, die immer abwechselnd beschrieben werden. Ziemlich kompliziert :-/

Zitat

Den Prozess mit dem Sichern auf zweite HDD, inklusive Erkennung sobald die zweite Platte im System steckt werde ich mit Windows Scripts lösen.

Meinst Du den Windows Scripting Host? Nur aus Interesse gefragt, wie kann man sich da mit einem Skript reinhaengen das aufgerufen wird wenn sich die HD Config aendert oder wie?

Windows Home Server hätte ich gar nicht zugetraut das der das kann. Wie funktioniert da die Wiederherstellung, bootet man da von der Windows Install CD und wählt dann irgendwo Network-recovery, oder wie geht das?

FrankEdwinWrigh

stuck on the outside
Avatar
Registered: Nov 2002
Location: im 21. Jhdt.
Posts: 2507
Zitat von Polyfire
Was ist wenn die Sysplatte genau zu dem Zeitpunkt verreckt?
Imho musst da mehrere Platten einplanen, die immer abwechselnd beschrieben werden. Ziemlich kompliziert :-/

oder eben einfach ein raid 1

Mfg

userohnenamen

leider kein name
Avatar
Registered: Feb 2004
Location: -
Posts: 15865
jo, wenns deppeneinfach sein muss, 2 idente rechner, jeweils bei beiden ein raid 1 konfigurieren
sollte eine platte eingehen, einfach die platte austauschen
sollte der rechner eingehen, einfach eine bzw. beide platten in den zweiten rechner schieben

EG

thinking with portals
Avatar
Registered: May 2004
Location: 11**
Posts: 3918
Wieso ned gleich ein Active-Standby Cluster mit Heartbeat? :D

Das ist zumindest Hochverfügbarkeit in meinem Verständnis.

"user holt 2. identen PC" is ned sonderlich hoch verfügbar...

.dcp

notamodbuthot
Avatar
Registered: Jul 2002
Location: new
Posts: 8881
keine ahnung wies mit der software aussieht, ob die im terminalserver betrieb funktioniert, aber ein failovercluster ist das was du suchst.

2 gleiche rechner ([rack]server mit redundantem netzteil wenns sein muss/darf) mit raid1+hotspare, 2003er/2008er server, failovercluster, terminalserver und 2 thinclients.
dann brauchste nur noch nen satz mäuse, tastaturen und bildschirme...dann kann der arme mann die nexten xx jahre 24/7 arbeiten.

ist natürlich alles wesentlich teurer und aufwändiger, aber auch viel cooler als festplatten tauschen :D

userohnenamen

leider kein name
Avatar
Registered: Feb 2004
Location: -
Posts: 15865
oder man spart sich gleich das ganze pipapo und holt sich einfach ne schöne dell workstation mit "4Yr ProSupport for End Users and 4hr Mission Critical" :D

LandeX

Little Overclocker
Registered: Nov 2003
Location: SBG / AT
Posts: 65
Moinmoin.
Danke für die Replys.

Also first of all, Dell PC mit Mission Critical, etc. kommt mal überhaupt nicht in die Tüte. Wieso ? Ich verlasse mich eher darauf das meine User meine Doku befolgen und ein paar Scripte ausführen, als das ich mich darauf verlasse das ein Dell Fuzzi mitten in der Nacht aufkreuzt :D

Ein Failovercluster mit Servern wird sicher mal wieder zu teuer :rolleyes: (hate it!)

@FrankEdwinWrigh: Klar, mechanische Probleme werden ja mit dem Einsatz von vernünftigen Wechselrahmen eingedämmt. Ein Datenverlust bis zu 24h kann der User hinnehmen, ich vergaß zu erwähnen das es eine entsprechende Datensicherung geben wird - entweder auf zusätzliche externe Medien oder mehrere kleine Wechsel-HDD's. Hier gehts erstmal wirklich nur um "Wie krieg ich das System asap wieder zum Laufen" :)

@Polyfire: Sollte die HDD genau zum Backup-Zeitpunkt verrecken hat man immer noch die zweite, funktionierende HDD. Allerdings danke ich dir für den Denkanstoss, denn wenn es mitten im Backuprozess passiert würde man eine dritte HDD benötigen. Und ja, ich meinte Scripting Host welcher mir dann die HDD im System erkennt. SATA ist zwar HotPlug fähig, aber ohne die Erkennung von geänderter Hardware funktioniert das nicht zuverlässig (meine bisherige Erfahrung).

Zum Thema RAID1: Das wäre nur möglich wenn der Controller beim Booten die neue HDD erkennt, adressiert und damit hochfährt. Eingriff im RAID Bios wäre denke ich für den User zu kompliziert und gefährlich.
Bearbeitet von LandeX am 30.01.2009, 08:49

FrankEdwinWrigh

stuck on the outside
Avatar
Registered: Nov 2002
Location: im 21. Jhdt.
Posts: 2507
@raid1: zumindest die erwähnten lenovo workstations die wir im einsatz haben machen das alleine.
abstecken, anstecken .. und er fängt an zu rebuilden.
das einzige was du noch selber machen musst ist rausfinden welche der beiden die kaputte ist :D
dafür gibts aber sicher was mit leds wie bei servern .

Mfg fEw

LandeX

Little Overclocker
Registered: Nov 2003
Location: SBG / AT
Posts: 65
Welche Lenovo's meinst du denn genau ? Das würd mich jetzt interessieren da ich auch viel mit Lenovo zu tun hab.

Das mit den LED's sollte kein Prob sein, die führ ich zum Frontpanel und bau noch eine zusätzlich ein bzw. beschrifte das ganze entsprechend.

Crash Override

BOfH
Registered: Jun 2005
Location: Germany
Posts: 2951
Wieviel Clients sollen so abgesichrt werden? Ab 3-4 Wird die Serverlösung auf jeden Fall die geringere TCO aufweisen. auf jeden Fall ist die Serverlösung fehlertoleranter.
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz