"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

XFX HD 5970: zweite GPU geht plötzlich nicht mehr

Rektal 22.12.2010 - 00:05 5025 26
Posts

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Hi,

habe diese Karte seit Mai, plötzlich funktioniert die zweite GPU nicht mehr.

Vor ein paar Stunden wars kein Problem, hab sogar noch mit GPU-Z Werte gemessen. Dann PC auf "Ruhezustand" abgedreht. Dabei gabs eine interessante Beobachtung meinerseits: nach ca. 15 Minuten ging plötzlich der rechte meiner zwei Dual-Monitore an, es gab aber kein Signal ?! Anyway, hab mich nich drum geschert. Zwei Stunden später aufgedreht, ist der PC hängen geblieben -> black screen. Hard reset, alles scheinte zu funktionieren, bis ich weitere Sachen mit GPU-Z messen wollte und plötzlich gemerkt habe, das ich nur mehr eine GPU hab.

Das bestätigt sich auch durch CCC (habe 10.12 seit einigen Tagen oben), als auch die Spiele selbst (ca. 40% weniger Framerate bei z.B Arma2:OA). Overdrive hab ich nicht verwendet, alles auf den Default werten. PC schon mehrmals neu gestartet, no change. Ich geh eine Runde weinen ...

Hier Screens von GPU-Z:
gpu_z_tab1_162744.png
gpu_z_tab2_162745.png

Any idea?
Bearbeitet von Rektal am 22.12.2010, 00:16

Viper780

Moderator
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 50096
ich finds interessant dass mans in GPU-z sieht und die Karte trotzdem geht.

das ist ein klarer Fall für die RMA

Turrican

Legend
Amiga500-Fan
Avatar
Registered: Jul 2002
Location: Austria,Stmk.
Posts: 23260
hmm, ich würde versuchen den treiber zu deinstallieren und dann neu aufzuspielen.

lalaker

TBS forever
Avatar
Registered: Apr 2003
Location: Bgld
Posts: 14699
Hast mit dem 10.12 den PC vorher schon erfolgreich in den "Ruhezustand" geschickt?

Falls nein, würde ich mal den 10.11 probieren. Wenn keine neue Treiber-Installation hilft ist die Karte wohl defekt.

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
@lalaker: hab den 10.12 schon länger oben und öfters neu gestartet gehabt ohne Probleme.

Ich krieg die Krise: jetzt nach 12 Stunden abgedreht gelassen, hängt das System beim Booten und bleibt stehen, ist genau das selbe Problem wie in dem anderen Thread von mir.

Neu gestartet, wieder hängen geblieben. Nochmal neu gestartet, Auswahl gehabt die "Starthilfe" zu verwenden, welche aber nichts finden konnte. Hab alles außer Maus abgesteckt (Audio Headphones+Mikro, Netz und Tastatur; Platte war keine extern), nochmal neu gestartet -> läuft wieder, und die zweite GPU ist auch da! Waaaaaaaaaaaaaaaaaaaa...... ich dreh die Schüssel einfach nicht mehr ab :(
Bearbeitet von Rektal am 22.12.2010, 13:26

lalaker

TBS forever
Avatar
Registered: Apr 2003
Location: Bgld
Posts: 14699
Also das NT sollte ja potent genug sein. Versuchs mal mit den anderen PCIe-Steckern (und kabeln vom NT), obwohl ich nicht glaube, dass es wirklich eine Lösung bringt.

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Danke, werde mir das notieren. Ich hab derzeit einen Gips auf der rechten Hand, rumfummeln mit HW unmöglich :(

Edit: Hab den Verdacht das es mit meinem bestehendem, sporadischem Systemproblem zusammenhängt, habe Details dort gepostet.
Bearbeitet von Rektal am 22.12.2010, 23:36

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Hatte soeben während Flash Film schauen zwei mal ein abdunkeln beider Monitore mit folgendem Hinweis:

ati_162811.png

Gleich danach GPU-Z gestartet (und weiterhin die selben Flash Filme geschaut), wirkt auf mich normal?
click to enlarge

Wie kann ich da mehr rausfinden?

lalaker

TBS forever
Avatar
Registered: Apr 2003
Location: Bgld
Posts: 14699
Vlt. kennst jemandem, der dir die Karte in seinem PC teste könnte (und gutes NT sollte er schon haben).

Wie sieht´s eigentlich aus, wenn du einen Benchmark laufen lässt?

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Das mit dem Testen könnte ich hinbiegen, danke, gute Idee. Mein Hauptproblem ist aber, das hier nichts reproduzierbar ist.

Das System schnurrt seit Stunden wieder dahin, Benches hab ich schon erfolgreich einige im Benchforum gepostet, 3D Mark in allen Varianten, auch den 2011er. Werte sind auch OK.

Es scheint sporadisch zu sein :( Das ist natürlich jetzt von wegen Hersteller auch nicht gerade einfach ...

lalaker

TBS forever
Avatar
Registered: Apr 2003
Location: Bgld
Posts: 14699
Das ist ein furchtbares Problem, wenn der Fehler nicht reproduzierbar ist.

Ist ja fast so, wie ein Wackelkontakt, die man einfach nicht finden kann.
Weil jeder Einzeltest bestätigt ja eigentlich, dass alles passt.

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Soeben hatte ich wieder folgendes Problem:

Den Rechner gestern in Ruhezustand gebracht. Jetzt aufgedreht, schreibt mir Windows dann nach ein paar Minuten hin, das es ein Problem mit der Wiederherstellung aus dem Ruhezustand gab. Ich bekam ein Menü wo ich mir aussuchen konnte, es nochmal zu probieren oder den Ruhezustand zu verwerfen und normal zu booten.

Hab mich für normal booten entschieden, hat dann alles OK ausgesehen. Da ich es mir seit vorgestern angewöhnt hatte, immer zwei mal GPU-Z zu starten und die Werte zwecks Analyse (wenn z.B. der AMD Treiber wieder mal im Desktop-Betrieb abstürzt) die Werte zu haben, kam ich gleich drauf das jetzt wieder nur eine GPU vorhanden ist.

Es dürfte also einen direkten Zusammenhang zwischen Ruhezustand und dem Grafikkarten/GPU-Problem geben. Ich hab den Rechner seit Mai und hab von Anfang primär den Rechner immer in den Ruhezustand geschickt und nie einfach nur heruntergefahren.

Die letzten von GPU-Z aufgenommenen Werte sehen so aus:

GPU1:
Code:
        Date        , GPU Core Clock [MHz] , GPU Memory Clock [MHz] , GPU Temperature [°C] , Fan Speed [%] , GPU Load [%] , Fan Speed [RPM] , GPU Temp. #1 [°C] , GPU Temp. #2 [°C] , GPU Temp. #3 [°C] , VDDC [V] , VDDCI [V] , VDDC Current [A] , VDDCI Current [A] , VDDC Phase #1 Temperature [°C] , VDDC Phase #2 Temperature [°C] , VDDC Phase #3 Temperature [°C] , VDDCI Phase #1 Temperature [°C] , VDDCI Phase #2 Temperature [°C] ,
2010-12-25 02:42:33 ,              400.0   ,               1000.0   ,               69.0   ,          30   ,          0   ,          1009   ,            68.5   ,            63.5   ,            63.0   , 1.0000   ,  1.1000   ,            1.7   ,            10.9   ,                           64   ,                           63   ,                           63   ,                            55   ,                            56   ,

2010-12-25 02:42:34 ,              400.0   ,               1000.0   ,               68.0   ,          30   ,          0   ,           999   ,            68.5   ,            63.0   ,            62.5   , 1.0000   ,  1.1000   ,            1.7   ,            10.9   ,                           64   ,                           62   ,                           63   ,                            55   ,                            56   ,

2010-12-25 11:10:33 ,              725.0   ,               1000.0   ,               68.0   ,          30   ,          6   ,           986   ,            68.5   ,            63.5   ,            63.0   , 1.0500   ,  1.1000   ,            5.2   ,            10.9   ,                           64   ,                           63   ,                           64   ,                            55   ,                            56   ,

2010-12-25 02:42:36 ,              725.0   ,               1000.0   ,               69.0   ,          30   ,          0   ,          1004   ,            69.5   ,            63.5   ,            63.5   , 1.0500   ,  1.1000   ,            5.2   ,            17.2   ,                           64   ,                           63   ,                           64   ,                            56   ,                            57   ,

2010-12-25 11:10:33 ,              725.0   ,               1000.0   ,               42.0   ,          30   ,          0   ,           845   ,            42.0   ,            40.5   ,            40.0   , 1.0500   ,  1.1000   ,           19.2   ,             8.8   ,                           38   ,                           36   ,                           38   ,                            32   ,                            34   ,

GPU2:
Code:
        Date        , GPU Core Clock [MHz] , GPU Memory Clock [MHz] , GPU Temperature [°C] , Fan Speed [%] , GPU Load [%] , Fan Speed [RPM] , GPU Temp. #1 [°C] , GPU Temp. #2 [°C] , GPU Temp. #3 [°C] , VDDC [V] , VDDCI [V] , VDDC Current [A] , VDDCI Current [A] , VDDC Phase #1 Temperature [°C] , VDDC Phase #2 Temperature [°C] , VDDC Phase #3 Temperature [°C] , VDDCI Phase #1 Temperature [°C] , VDDCI Phase #2 Temperature [°C] ,
2010-12-25 02:42:33 ,              157.0   ,                300.0   ,               66.0   ,          30   ,          0   ,             -   ,            66.5   ,            61.0   ,            64.0   , 1.0500   ,            1.7   ,                           54   ,                           53   ,                           53   ,

2010-12-25 02:42:34 ,              157.0   ,                300.0   ,               66.0   ,          30   ,          0   ,             -   ,            66.5   ,            61.5   ,            63.5   , 1.0500   ,            1.7   ,                           54   ,                           53   ,                           53   ,

2010-12-25 11:10:33 ,              157.0   ,                300.0   ,               66.0   ,          30   ,          0   ,             -   ,            66.5   ,            61.0   ,            64.0   , 1.0500   ,            1.7   ,                           54   ,                           53   ,                           52   ,

2010-12-25 02:42:36 ,              725.0   ,               1000.0   ,               67.0   ,          30   ,          6   ,             -   ,            67.5   ,            63.0   ,            67.0   , 1.0500   ,            5.2   ,                           54   ,                           53   ,                           53   ,

2010-12-25 11:10:31 ,              360.0   ,               2500.0   ,               31.0   ,          30   ,          0   ,             -   ,            25.0   ,            24.0   ,            32.0   ,      -   ,            0.0   ,                            0   ,                            0   ,                            0   ,

Finde ich jetzt nichts bedenkliches, außer diesen Timestamp-Sprung, aber vielleicht ist das nicht ungewöhnlich wenn der Rechner seine Apps in den Ruhezustand versetzt.

Ich hab jetzt die Ereignisanzeige durchforstet und diverse Einträge rausgesucht:

Code:
Fehler    25.12.2010 11:12:49    Eventlog           1101    Ereignispozessor
    Überwachungsereignisse wurden vom Transport gelöscht. 0
Warnung   25.12.2010 11:12:48    RTL8167            1       Keine
    Realtek PCIe GBE Family Controller is disconnected from network.
Fehler    25.12.2010 11:12:45    Application Popup  1060    Keine
    Aufgrund der Inkompatibilität mit diesem System wurde
    \SystemRoot\SysWow64\Drivers\GEARAspiWDM.sys nicht geladen. Wenden Sie sich
    an den Softwarehersteller, um eine kompatible Version des Treibers zu
    erhalten.
Warnung   25.12.2010 11:12:45    Kernel-PnP         219     (212)
    Fehler beim Laden des Treibers \Driver\GEARAspiWDM für das Gerät
    SCSI\CdRom&Ven_KBC&Prod_01YB05IV812N&Rev_1.03\5&36e5972&0&000000.
Warnung   25.12.2010 11:12:43    Kernel-PnP         219     (212)
    Fehler beim Laden des Treibers \Driver\GEARAspiWDM für das Gerät
    IDE\CdRomPLEXTOR_BD-R___PX-B940SA________________1.08____\5&4f7d517&0&3.0.0.
Fehler    25.12.2010 11:12:43    Application Popup  1060    Keine
    Aufgrund der Inkompatibilität mit diesem System wurde
    \SystemRoot\SysWow64\Drivers\GEARAspiWDM.sys nicht geladen. Wenden Sie sich
    an den Softwarehersteller, um eine kompatible Version des Treibers zu
    erhalten.
Kritisch  25.12.2010 11:12:43    Kernel-Power       41      (63)
    Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß
    heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht
    mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet
    unterbrochen wurde.
Fehler    25.12.2010 11:12:48    EventLog           6008    Keine
    Das System wurde zuvor am ?25.?12.?2010 um 11:10:31 unerwartet heruntergefahren.

Ich hab vorher noch nie so wirklich ins Log gesehen, d.h. für mich sind die jetzt einmal alle neu. Die Fehlermeldung mit dem GEARAspiWDM hab ich seit Ende Oktober. Aber interessanterweise auch das erste mal nachdem das System unerwartet heruntergefahren wurde, kommt seit dem aber regelmäßig. Probleme mit dem BluRay-Drive habe ich aber nicht, erst gestern wieder verwendet. Ich hab gefunden wie ich es entfernen kann, aber mir ist nicht ganz klar ob das eine gute Idee ist. Da ich ja Brenn-Software installiert habe, habe ich den Treiber von http://www.gearsoftware.com/support/drivers.php aktualisiert.

Hab auch sonst die ganzen Ereignisse mir durchgesehen, aber nichts gefunden bzw. ist schwer da mir auch nicht klar ist nach was ich suchen muss.

PS: gibt es eine Möglichkeit das code-Tag zu verwenden ohne das die Breite so aufgeblasen wird ... ?

Edit: nach Neustart (wobei ich schon per Knopf ganz runtergefahren hab), ist die zweite GPU wieder da.
Bearbeitet von Rektal am 25.12.2010, 12:11

Turrican

Legend
Amiga500-Fan
Avatar
Registered: Jul 2002
Location: Austria,Stmk.
Posts: 23260
anscheinend "wacht" sie zweite gpu aus dem ruhezustand nicht immer auf.
hast du mal im amd/ati forum geschaut ob es da eine lösung gibt?

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Bin noch nicht auf die Idee gekommen :) Hab gleich nachgesehen, aber nur generelle Probleme gefunde, hab daher einen neuen Thread eröffnet.

Rektal

Here to stay
Registered: Dec 2002
Location: Inside
Posts: 4457
Hatte das Problem heute früh wieder. Nach Restore von Ruhezustand konnte nicht wiederhergestellt werden, Reboot und nur eine GPU. Herunterfahren, Neu starten, alles OK.

In der Ereignisanzeige scheint der Fehler mit GEARAspiWDM.sys nicht mehr auf, das hat das Update der Treiber anscheinend behoben, ich hab dem aber sowieso keine Relevanz zu meinem Problem beigemessen.

Auch sonst gibt es keine neuen oder detailierteren Hinweise in der Ereignisanzeige.

Aber ich glaub eines ist mir aufgefallen, dem ich vorher nie so Aufmerksamkeit geschenkt habe: Beim aufdrehen braucht der Rechner sehr lange, bis das erste mal die Bios-Infos am Schirm stehen. Gefühlte 15 bis 25 Sekunden, und dann fängt er erst an mit der Bios/Boot-Sequenz. Bis dahin ändert sich die Motherboard-Diagnostic-LED-Anzeige ständig, zeigt mir halt alle paar Sekunden andere Codes an, bis das System dann bootet.

Wie gesagt, da hab ich nie so draufgeschaut, kennen das andere auch? Kann das a der GFX-Karte liegen?
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz