Ergebnis 1 bis 10 von 10

Harter Systemabsturz und Boot-Loop durch defekte/leere CMOS-Batterie?

  1. #1 Zitieren
    Drachentöter Avatar von Lord-Hagen
    Registriert seit
    Apr 2009
    Beiträge
    4.507
    Hallo zusammen,

    an meinem PC ist gestern Abend ein Problem aufgetreten, das ich in dieser Form noch nie erlebt habe. Da ich mir unsicher bin, wie ich den Vorfall bewerten soll, wollte ich hier mal nach Meinungen fragen.

    Konkret sind mir gestern Abend beim Spielen von „Mass Effect: Andromeda“ Bild und Ton eingefroren. Der PC hat daraufhin weder auf Alt + F4, Strg + Alt + Entf, die Windows-Taste oder andere Tastenkombinationen reagiert. Das ist erstmal ungewöhnlich, hat mich aber noch nicht weiter beunruhigt. Ich habe den PC daher hart heruntergefahren, indem ich die An-/Austaste mehrere Sekunden lang gedrückt gehalten habe. Als ich den PC anschließend wieder hochfahren wollte, hing er allerdings in einer Boot-Loop fest. Konkret hat der PC die Lüfter anlaufen lassen, man hat die HDD anlaufen hören, allerdings erschien noch nicht einmal der BIOS-Screen, ehe der PC wieder herunterfuhr, nur um wieder zu versuchen zu booten. Auch ein Wegnehmen des PCs vom Strom konnte diese Boot-Loop nicht durchbrechen. Einmal ist der Mainboard-Startbildschirm erschienen, hat dann aber auch nicht auf Eingabe reagiert – man konnte durch Druck von F2 bspw. nicht ins BIOS gelangen. Daraufhin habe ich gelesen, dass ein solcher Boot-Loop eventuell mit einer defekten/leeren CMOS-Batterie zu tun haben könnte, weswegen ich diese auf gut Glück getauscht habe. Tatsächlich war die auf dem Mainboard verbaute Batterie auch völlig leer. Und tatsächlich läuft der Rechner jetzt auch wieder, allerdings bin ich mir nicht wirklich sicher, ob der harte Systemabsturz und die darauf folgende Boot-Loop wirklich mit einer defekten CMOS-Batterie zusammenhängen kann.

    Kann das sein oder liegt die wahre Ursache dieses Problems womöglich ganz wo anders? Ich dachte immer, dass diese Batterie nur dazu da ist, BIOS-Settings zu speichern, aber eigentlich keine großen Einflüsse auf Dinge wie den Boot-Prozess hat. Ist es vielleicht wahrscheinlicher, dass der harte Reset nach dem Einfrieren meines Systems irgendeinen Wurm erzeugt hat, der durch ein Zurücksetzen des BIOS durch das Austauschen der CMOS-Batterie behoben worden ist? Ich bin mir gerade einfach unsicher, ob das ursächliche Problem wirklich in der leeren CMOS-Batterie lag, oder ob sich hier eher irgendein Hardwaredefekt ankündigt. Ich sollte dazu vielleicht erwähnen, dass der Kern meines Systems – allen voran CPU und Mainboard – inzwischen über 10 Jahre alt und damit nicht mehr ganz taufrisch sind.

    Im Voraus schon mal danke für eure Einschätzungen, insofern solche anhand dieser wagen Informationen überhaupt möglich sind.

    Lord-Hagen
    Lord-Hagen ist offline Geändert von Lord-Hagen (16.09.2023 um 04:43 Uhr)

  2. #2 Zitieren

    Metasyntaktische Variable
    Avatar von foobar
    Registriert seit
    Sep 2004
    Ort
    Direkt hinter dir! Buh!
    Beiträge
    24.078
    Das ist durchaus möglich, dass die Batterie die Ursache war. Sicher sagen kann man es aus der Ferne natürlich nicht, aber die Batterie versorgt neben der Uhr auch das NVRAM (non-volatile RAM), in welchem das BIOS alle Daten speichert. Dazu gehören unter anderem auch die Einstellungen im Setup. Und wenn du mal überlegst, was man alles im Setup einstellen kann, das die Funktion des Rechners betrifft (bspw. RAM-Timings, CPU-Takt, etc.), dann wird klar, wie durch Strommangel korrumpierte Daten das BIOS aus dem Gleichgewicht bringen können.

    Aber im NVRAM liegt noch mehr als nur deine Setup-Einstellungen. Auch die Resultate des RAM-Trainings werden dort hinterlegt. Wenn du den Rechner zum ersten Mal (bzw. zum ersten Mal nach einem CMOS-Reset) in Betrieb nimmst, dauert es u.U. etwas länger, bis der gewohnte Boot-Screen erscheint. Eventuell geht er sogar ein paar Mal kurz aus und wieder an. In der Zeit vollzieht das Board ein RAM-Training. Alle RAM-Riegel hängen am selben Bus (auf Kanäle gehe ich hier mal nicht ein), sind aus Sicht des RAM-Controllers in der CPU also unterschiedlich weit weg. Aus Sicht des RAM-Moduls wiederum gibt es unterschiedliche Verzerrungen zwischen Takt und Daten. Die sind abhängig vom konkreten Board, dem jeweiligen RAM-Modul, den Herstellungstoleranzen beider, den verwendeten Timings und Spannungen und einigem mehr. Bei den hohen Frequenzen, die RAM heutzutage hat, spielt das alles eine Rolle. Daher fährt das System bei der Initialisierung einige Tests, um die genaue Verzerrung zu ermitteln und dann eine passende „Gegenverzerrung” zu errechnen. Die Signale zum RAM werden quasi vor dem Versenden so verfälscht, dass die unterwegs erlittenen Verzerrungen gerade wieder kompensiert werden und ein möglichst perfektes Signal beim DIMM ankommt. Damit das Training nicht bei jedem Einschalten auf’s Neue notwendig ist, werden die Ergebnisse im NVRAM hinterlegt.

    Sogar im Betrieb wird ab und zu nachkalibriert, weil die Werte mit Zeit, Temperatur, Spannung und so weiter auch driften. Und falls dafür die bereits gespeicherten Werte im NVRAM heran gezogen werden (was IMHO Sinn macht, damit man nicht wieder bei Null anfangen muss, aber ich konnte auf die Schnelle keine definitiven Aussagen dazu finden), und diese Werte dann durch die leere Batterie völliger Blödsinn sind, dann könnte es auch erklären, warum die Kiste mitten im Betrieb plötzlich auf die Fresse geflogen ist.

    Beobachte es einfach mal eine Weile, aber wenn nichts weiter passiert, dann war es die Batterie.

    Feeling a bit masochistic and want to read more of my diatribes? Check out Foobar's Rantpage.

    foobar erklärt die Welt der Informatik: Was ist ein Zeichensatz?Was ist die 32Bit-Grenze?Warum sind Speicheroptimierer Unsinn?Wie teste ich meinen RAM?Was ist HDR?Was ist Tesselation?Warum haben wir ein Urheberrecht?Partitionieren mit MBR oder GPT?Was hat es mit dem m.2-Format auf sich?Warum soll ich meine SSD nicht zum Anschlag befüllen?Wer hat an der MTU gedreht?UEFI oder BIOS Boot?Was muss man über Virenscanner wissen?Defragmentieren sinnvoll?Warum ist bei CCleaner & Co. Vorsicht angesagt?Was hat es mit 4Kn bei Festplatten auf sich?Was ist Bitrot?Was sind die historischen Hintergründe zur (nicht immer optimalen) Sicherheit von Windows?Wie kann ich Datenträger sicher löschen?Was muss ich bzgl. Smartphone-Sicherheit wissen?Warum sind Y-Kabel für USB oft keine gute Idee?Warum sind lange Passwörter besser als komplizierte?Wie funktionieren Tintenstrahldrucker-Düsen?Wie wähle ich eine Linux-Distribution für mich aus?Warum ist Linux sicherer als Windows?Sind statische Entladungen bei Elektronik wirklich ein Problem?Wie repariere ich meinen PC-Lüfter?Was ist die MBR-Lücke?Wie funktioniert eine Quarz-Uhr?Was macht der Init-Prozess unter Linux und wie schlimm ist SystemD?Mainboard-Batterie - wann wechseln?Smartphone ohne Google?
    foobar ist offline Geändert von foobar (16.09.2023 um 12:08 Uhr) Grund: Formulierungsoptimierung

  3. #3 Zitieren

    Metasyntaktische Variable
    Avatar von foobar
    Registriert seit
    Sep 2004
    Ort
    Direkt hinter dir! Buh!
    Beiträge
    24.078
    Als Nachtrag für diejenigen, die wissen wollen, ab wann die CMOS-Batterie zu wechseln ist: Verbindliche Standards gibt es IMHO nicht, aber die üblichen CR2032-Zellen haben eine Nennspannung von 3V. Frisch aus der Packung liegen sie meist etwas höher (~3,2V) und mit dem Alter lässt die Spannung dann langsam nach. Sobald die Batterie unter 2,9V fällt, würde ich persönlich sie lieber austauschen. Zu dem Zeitpunkt hat sie ihre halbe Lebenserwartung bereits hinter sich und da die Dinger kaum was kosten und man sie ja nicht regelmäßig prüft, ist das IMHO ein guter Zeitpunkt, sie vorsorglich zu wechseln. Unter 2,6V ist sie praktisch leer und muss getauscht werden.

    Und wenn das Board irgendwelche Probleme macht und die CMOS-Batterie keine 3V mehr hat, ist ein testweises Wechseln ebenfalls angeraten. Nur, weil die Zelle selbst vielleicht noch eine gute Weile lang stabile 2,8V liefern könnte, heißt das nicht zwangsläufig, dass das Board mit der niedrigeren Spannung auch klar kommt. Sollte es eigentlich, wenn der Designer ordentlich gearbeitet hat. Aber es wäre nicht das erste Mal, dass jemand schludert oder sich dem Kostendruck beugt und „Kompromisse” macht. Man trifft im Alltag immer wieder auf batteriebetriebene Geräte, die bereits den Dienst quittieren, wenn die Batterien noch halb voll sind.

    Wichtig: Man sollte die Spannung immer messen, wenn die Zelle noch im Board sitzt (also unter Last). Batterien haben die Eigenschaft, dass die Spannung langsam wieder ansteigt, wenn die Last wegfällt. Der Innenwiderstand bleibt aber hoch und die Spannung bricht sofort ein, wenn die Zelle erneut belastet wird. Wer eine lose Batterie mit einem Multimeter misst (welches i.d.R. einen hochohmigen Eingang hat, der keine nennenswerte Last darstellt), der kann den Messwerten nicht trauen. Selbst leere Batterien könnten 3V anzeigen und noch gut aussehen.

    Als Praxisbeispiel hier mal ein Bild von einer praktisch leeren BIOS-Batterie: Im Betrieb misst man 2,6V. Aber hier haben wir die selbe, leere Batterie und auf einmal hat sie wieder fast genau 3V. Ist sie also wieder gut geworden? Natürlich nicht. Im zweiten Bild habe ich sie aus dem Mainboard genommen und ein paar Sekunden liegen lassen. Und als die Last wegfiel, hat sich die Spannung wieder einigermaßen erholt. Aber sobald ich sie ins Board zurück setze, fällt die Spannung wieder ab.

    Man muss auch nicht direkt die Unterseite der Batterie messen. Jede Masse (z.B. das Metallgehäuse eines USB-Anschlusses oder der Pin am ATX-Anschluss ganz rechts auf der Seite mit der Einrast-Nase) reicht. Wer die Zelle trotzdem im Mainboard direkt nicht messen kann, der kann einen Widerstand benutzen, um eine Last zu simulieren. Irgendwas im Bereich 10-50 kΩ sollte eigentlich reichen. Es gibt auch spezielle Batterie-Tester, die eine eingebaute Prüf-Last haben.

    Feeling a bit masochistic and want to read more of my diatribes? Check out Foobar's Rantpage.

    foobar erklärt die Welt der Informatik: Was ist ein Zeichensatz?Was ist die 32Bit-Grenze?Warum sind Speicheroptimierer Unsinn?Wie teste ich meinen RAM?Was ist HDR?Was ist Tesselation?Warum haben wir ein Urheberrecht?Partitionieren mit MBR oder GPT?Was hat es mit dem m.2-Format auf sich?Warum soll ich meine SSD nicht zum Anschlag befüllen?Wer hat an der MTU gedreht?UEFI oder BIOS Boot?Was muss man über Virenscanner wissen?Defragmentieren sinnvoll?Warum ist bei CCleaner & Co. Vorsicht angesagt?Was hat es mit 4Kn bei Festplatten auf sich?Was ist Bitrot?Was sind die historischen Hintergründe zur (nicht immer optimalen) Sicherheit von Windows?Wie kann ich Datenträger sicher löschen?Was muss ich bzgl. Smartphone-Sicherheit wissen?Warum sind Y-Kabel für USB oft keine gute Idee?Warum sind lange Passwörter besser als komplizierte?Wie funktionieren Tintenstrahldrucker-Düsen?Wie wähle ich eine Linux-Distribution für mich aus?Warum ist Linux sicherer als Windows?Sind statische Entladungen bei Elektronik wirklich ein Problem?Wie repariere ich meinen PC-Lüfter?Was ist die MBR-Lücke?Wie funktioniert eine Quarz-Uhr?Was macht der Init-Prozess unter Linux und wie schlimm ist SystemD?Mainboard-Batterie - wann wechseln?Smartphone ohne Google?
    foobar ist offline Geändert von foobar (06.11.2023 um 10:20 Uhr) Grund: Ergänzung

  4. #4 Zitieren
    Drachentöter Avatar von Lord-Hagen
    Registriert seit
    Apr 2009
    Beiträge
    4.507
    Danke für die schnelle und ausführliche Antwort. Das war äußerst lesenswert. Ich hoffe demnach wirklich, dass es einfach die über 11 Jahre alte Batterie war, die hier das Problem war, werde die Sache aber weiter beobachten
    Lord-Hagen ist offline

  5. #5 Zitieren
    General Avatar von Nobbi Habogs
    Registriert seit
    Nov 2010
    Beiträge
    3.979
    Also ich hab noch nie erlebt, dass eine leere CMOS-Batterie eine Systeminstabilität verursacht, zumindest wenn das System mit default-settings stabil läuft, was immer der Fall sein sollte. Ich hab nur schon erlebt, dass Boards teilweise keinen Start zulassen wenn die Batterie leer ist. Bei irgendeinem alten AM3 Board war das mal der Fall.
    Üblich ist es sicherlich nicht, dass das System einfriert weil die CMOS Batterie leer ist. Möglicherweise war sie aber auch defekt.
    Technisch auszuschließen ist die Batterie als Ursache auf jeden Fall nicht.
    Mit einem korrupten Speicherstand ist nicht zu spaßen. Sicherheitshalber würde ich die beiden Slots über und unter dem korrupten besser auch frei lassen. Man weiß ja nie. - Matteo
    [Bild: downloadvpk5n.gif]
    Nobbi Habogs ist offline

  6. #6 Zitieren
    Drachentöter Avatar von Lord-Hagen
    Registriert seit
    Apr 2009
    Beiträge
    4.507
    Tatsächlich war die defekte oder leere CMOS-Batterie wohl nicht ursächlich für den Systemcrash, weil sich das Szenario vor gut einer Stunde wiederholt hat. Dazwischen lagen ein paar Sessions mit dem PC, in dem dieser keine Anzeichen einer Instabilität gezeigt hat. Inzwischen habe ich auch "Mass Effect: Andromeda" beendet, bei dem der erste Crash vor einem Monat auftrat. Dieses Mal ereignete sich der Systemabsturz während des Spielens von "The Surge 2", also wieder in einem Spiel. Nur dass der PC diesmal von selbst abgestürzt und in einer Boot Loop gelandet ist und ich den Hard Reset nicht eigens erzwingen musste. Zwischenzeitlich schaffte der PC dann sogar aus der Boot Loop zu entkommen und sogar bis in die Windows-Anmeldemaske zu gelangen, nur um darin abzustürzen und wieder in der Boot-Loop zu landen, wo der PC noch nicht einmal zum Laden des BIOS-Screens kommt. Rein aus Interesse und Ratlosigkeit habe ich dann erstmal wieder die CMOS-Batterie überprüft. Diese war aber erwartungsgemäß nach wie vor voll. Nach erneutem Einlegen der Batterie fuhr der PC dann aber tatsächlich auch wieder ohne Boot Loop hoch - was aber vermutlich nur Zufall war.

    Die Frage ist jetzt nur: Was tun? Das Problem scheint bisher nicht besonders reproduzierbar in Spielen aufzutreten - jedenfalls in den zwei Situationen, in denen der Crash mit anschließender Boot-Loop bisher auftrat. Ich bin gerade aber nicht geneigt, erneut einen Absturz zu provozieren, sondern werde wohl erstmal die Daten des Rechners sichern, bevor der PC noch völlig seinen Geist aufgibt. Aber dennoch würde mich interessieren, wie ich nun bei der Ursachenforschung weiter vorgehen kann. Irgendwo muss der Hund ja begraben sein - vielleicht doch ein sich irgendwo andeutendes Hardwareversagen?
    Lord-Hagen ist offline

  7. #7 Zitieren

    Metasyntaktische Variable
    Avatar von foobar
    Registriert seit
    Sep 2004
    Ort
    Direkt hinter dir! Buh!
    Beiträge
    24.078
    Ok, in dem Fall musst du halt etwas Aufwand treiben. Eine erste vergleichsweise einfache Maßnahme wäre ein Speichertest mit MemTest86+ und eine anschließende Prüfung des Dateisystems (Anleitung). Wenn sich da nichts offenbart, gibt es zwei weitere Ansätze:

    • Software. Vielleicht ist das Windows irgendwie angeknackst. Installiere es mal komplett neu (von einem via MCT frisch erstellten USB-Stick), ggf. in eine kleine Testpartition. Installiere dort dann nur das absolut notwendige Minimum an Treibern (Grafik, ggf. Sound) und probiere, ob das Problem bestehen bleibt.
    • Hardware. Vielleicht verabschiedet sich irgendeine Komponente im Rechner. Baue alles aus, was nicht zwingend gebraucht wird und beim Rest musst du dann immer eine Komponente testweise austauschen, bis die Probleme verschwinden. Fange mal mit dem Netzteil an.


    Suche dir einen aus (ist im Prinzip egal, welcher) und wenn sich dort nichts ergibt, dann probiere den anderen. Software kostet erstmal nur Zeit, Hardware geht gleich ins Geld, wenn du keine passenden Ersatzkomponenten da hast.

    Feeling a bit masochistic and want to read more of my diatribes? Check out Foobar's Rantpage.

    foobar erklärt die Welt der Informatik: Was ist ein Zeichensatz?Was ist die 32Bit-Grenze?Warum sind Speicheroptimierer Unsinn?Wie teste ich meinen RAM?Was ist HDR?Was ist Tesselation?Warum haben wir ein Urheberrecht?Partitionieren mit MBR oder GPT?Was hat es mit dem m.2-Format auf sich?Warum soll ich meine SSD nicht zum Anschlag befüllen?Wer hat an der MTU gedreht?UEFI oder BIOS Boot?Was muss man über Virenscanner wissen?Defragmentieren sinnvoll?Warum ist bei CCleaner & Co. Vorsicht angesagt?Was hat es mit 4Kn bei Festplatten auf sich?Was ist Bitrot?Was sind die historischen Hintergründe zur (nicht immer optimalen) Sicherheit von Windows?Wie kann ich Datenträger sicher löschen?Was muss ich bzgl. Smartphone-Sicherheit wissen?Warum sind Y-Kabel für USB oft keine gute Idee?Warum sind lange Passwörter besser als komplizierte?Wie funktionieren Tintenstrahldrucker-Düsen?Wie wähle ich eine Linux-Distribution für mich aus?Warum ist Linux sicherer als Windows?Sind statische Entladungen bei Elektronik wirklich ein Problem?Wie repariere ich meinen PC-Lüfter?Was ist die MBR-Lücke?Wie funktioniert eine Quarz-Uhr?Was macht der Init-Prozess unter Linux und wie schlimm ist SystemD?Mainboard-Batterie - wann wechseln?Smartphone ohne Google?
    foobar ist offline

  8. #8 Zitieren
    General Avatar von Nobbi Habogs
    Registriert seit
    Nov 2010
    Beiträge
    3.979
    Ich persönlich gehe stark von einem Problem mit dem Netzteil aus. Die Hardwarekonfiguration kenne ich zwar nicht genau, aber wenn das Netzteil ebenso 11 Jahre alt ist, dann wundert mich das nicht. Es schadet daher sowieso nicht, dass Netzteil zu tauschen, um es auch bei zukünftiger Hardware als vernünftige Grundlage weiterverwenden zu können. Würde da mindestens folgendes Teil nehmen:
    https://geizhals.de/be-quiet-system-...-a2836182.html

    Wenn man sehr gute Qualität haben möchte (und 10 Jahre Garantie), wäre folgendes Modell passend:
    https://geizhals.de/be-quiet-pure-po...-a2884048.html

    Angaben natürlich ohne Gewähr, da ich das System nicht kenne.
    Mit einem korrupten Speicherstand ist nicht zu spaßen. Sicherheitshalber würde ich die beiden Slots über und unter dem korrupten besser auch frei lassen. Man weiß ja nie. - Matteo
    [Bild: downloadvpk5n.gif]
    Nobbi Habogs ist offline

  9. #9 Zitieren
    Drachentöter Avatar von Lord-Hagen
    Registriert seit
    Apr 2009
    Beiträge
    4.507
    Ich sichere zwar gerade noch Daten und habe noch nicht mit der Fehlersuche angefangen, aber so alt ist das Netzteil noch nicht. Das habe ich 2017 zusammen mit einigen weiteren Komponenten erneuert und ist damit "erst" ziemlich genau sechs Jahre alt. Das System sieht derzeit so aus:

    Prozessor: Intel Core i5-3570K, 4 x 3.40 GHz (seit 08/2012)
    CPU-Kühler: EKL Alpenföhn Brocken 3 (seit 03/2020)
    Grafikkarte: 8GB Gainward GeForce GTX 1080 Phoenix Golden Sample (seit 10/2017)
    Mainboard: ASRock Z75 Pro3 (seit 08/2012)
    RAM: 8GB TeamGroup Elite DIMM Kit PC3-10667U CL9-9-9-24 (DDR3-1333) (seit 08/2012)
    8GB (2x 4096MB) Corsair XMS3 DDR3-1333 DIMM CL9-9-9-24 Dual Kit (seit 10/2017)
    (insgesamt 16 GB DDR3-1333)
    Festplatten (SSD): 500GB Samsung 850 Evo (seit 10/2017)
    2TB Samsung 870 Evo (seit 12/2022)
    Festplatte (HDD): Seagate Barracuda EcoGreen F3 1000GB 7200rpm (seit 08/2012)
    optische Laufwerke: LiteOn iHAS122 schwarz (seit 08/2012)
    LG BH16NS40 Interner Blu-ray Brenner (seit 09/2013)
    Netzteil: 500 Watt be quiet! Straight Power 10 CM Modular 80+ Gold (seit 10/2017)
    Gehäuse: be quiet! Silent Base 600 Midi-Tower orange (seit 03/2020)
    Betriebssystem: Microsoft Windows 10 Home 64Bit
    Lord-Hagen ist offline

  10. #10 Zitieren
    General Avatar von Nobbi Habogs
    Registriert seit
    Nov 2010
    Beiträge
    3.979
    Ja gut, auf das Mainboard kann es halt auch immer sein, aber das wirst du halt schlecht testen können gehe ich mal von aus. Das Netzteil ist ja wirklich nicht so alt und sollte keine Probleme machen.
    Mit einem korrupten Speicherstand ist nicht zu spaßen. Sicherheitshalber würde ich die beiden Slots über und unter dem korrupten besser auch frei lassen. Man weiß ja nie. - Matteo
    [Bild: downloadvpk5n.gif]
    Nobbi Habogs ist offline

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •