Hallo,
eine allgemeine Frage: Ich habe vor ca. 1-2 Monaten Arch mit Plasma neu aufgesetzt und hatte jetzt im Dateisystem (ext4) Fehler, die das System spontan einfrieren ließen, welche mit fsck behoben werden mussten. Dabei habe ich diese Zeit nur 08/15-Sachen gemacht (Textverarbeitung, Internet inkl. Arch-Updates). Der Rechner wurde gleich durchgetestet (CPU, RAM, SSDs - alles ok). Wodurch könnten diese Fehler (nach so kurzer Zeit) auftreten?

  • GerBra hat auf diesen Beitrag geantwortet.

    Ein defekter Festplatten Controller, Stromunterbrechungen, Rechner abschalten ohne runter zu fahren, defektes SATA Kabel ... ect. pp.

    Wird das Dateisystem regelmäßig bei Systemstart gechecked? Schau mal in die /etc/fstab.

    Ok, danke, da kann man ja noch schön weitersuchen, wenn es das sein sollte. Da gestern ein Update-Fehler bei AMD-CPUs gemeldet wurde, schliesse ich das mal mit in die Suche ein (Rechner hat AMD-APU). Das Einfrieren trat nämlich erst seit gestern auf, die Fehler im Dateisystem waren schon vorher da, daher schob ich auch das Einfrieren auf diese. In fstab ist sind Checks beim Boot eingetragen, allerdings kamen sie komischerweise immer wieder, so dass ich fsck manuell laufen liess und auch dort wieder Fehler gefunden wurden. Heute kam direkt nach dem gestrigen Update ein neues Vulkan-Update, vielleicht hatte das Einfrieren ja auch damit zu tun? Ich warte mal ab und berichte (falls nicht, hat es sich damit erledigt).

    Meiner Erfahrung nach sind auftretende Fehler im Dateisystem (ohne daß der Rechner aus irgendwelchen Gründen "hart" rebootet werden muß) zu 95% auf problematische Hardware und ggf. zu 5% auf "Bugs" zurückzuführen (das müßte dann Kernel+dessen FS/Hardware-Module sein, seltenst Userland-Programme).

    Schau am besten für die Zeitpunkte:

    • gemerktes Auftreten der Dateisystem(FS)-Fehler
    • "Einfrieren"
    • Reparatur per fsck (wie hast du diese vorgenomen? Offline?)
      ins Journal (journactl). Sowohl Zeitpunkte als auch Devices/Dateisysteme lassen sich gut filtern.
      Im Zweifelsfall stelle das ganze Journal ab Auftreten der Probleme auf einen Pastebin-Server und poste den Link hier.

    Gibt es irgendwelche "richtigen" Fehlermeldungen zu dem/den Problemen?

    Berni341 Der Rechner wurde gleich durchgetestet (CPU, RAM, SSDs - alles ok).

    Sofort die Frage: Gerade bei dem Test der SSDs - wie hast du das überprüft? Wenn mittels smartctl, hast du dann auch einen langen Test laufen lassen? Nur das smartctl "passed" melden bedeutet ohne Tests lediglich daß die Disk nicht kurz vom Sterben ist. Besonderer Augenmerk hier auch auf die verschiedenen SMART-Attribute.

    Wenn du RAM testest, dann am besten eine Nacht lang (also mehrere Stunden). Es kann sein, dass RAM-Fehler nicht sofort auftreten. Sollte ein Fehler auftreten, dann kannst du auch gleich abbrechen. Dann müsstest du gegebenenfalls die Riegel einzeln durchtesten, um den fehlerhaften Riegel zu finden.

    Wie alt sind die Hardwarekomponenten? Es kann auch sein, dass ein Teil schon defekt geliefert wird.

    Ansonsten Sichtkontrolle des Mainboards auf geplatzte Elkos. Alle Kabel überprüfen (kein Wackelkontakt).

    Reicht das Netzteil für alle Komponenten?
    SMART-Ausgabe am besten gleich hier posten, damit man sich das ganze anschauen kann.

    Auch mal die Firmware aktualisieren.

    Danke erstmal für die Antworten. Was als allgemeine Frage begann, wird langsam immer verrückter. Folgendes:
    Arch friert seit gestern nach einem Update immer noch spontan und unvorhersehbar ein. Was aber NICHT einfriert und problemlos läuft: Arch Fallback und Windows 11. Da alle Hardware-Tests soweit es möglich war, gemacht sind, schliesse ich aufgrund der beiden laufenden Installationen (Arch Fallback und Windows) einen Hardware-Defekt bis hier aus. Der Fehler der Haupt-Arch-Installation trat nach Updates folgender Packages (welche fehlerfrei durchliefen) auf:
    [2024-12-06T15:30:42+0100] [ALPM] upgraded sqlite (3.47.1-1 -> 3.47.1-2)
    [2024-12-06T15:30:42+0100] [ALPM] upgraded hwdata (0.389-1 -> 0.390-1)
    [2024-12-06T15:30:42+0100] [ALPM] upgraded fwupd (2.0.2-1 -> 2.0.3-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded libwacom (2.13.0-1 -> 2.14.0-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded mesa (1:24.2.7-1 -> 1:24.3.1-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded python-sentry_sdk (2.19.0-1 -> 2.19.2-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded sof-firmware (2024.09.1-1 -> 2024.09.2-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded vulkan-intel (1:24.2.7-1 -> 1:24.3.1-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded vulkan-radeon (1:24.2.7-1 -> 1:24.3.1-1)
    [2024-12-06T15:30:43+0100] [ALPM] upgraded zlib-ng (2.2.2-2 -> 2.2.2-3)

    Heute kam nochmal ein Vulkan-radeon Update und eines der vulkan-tools, aber leider doch keine Änderung, wie zunächst geglaubt. Backups der alten Versionen der upgedateten Packages habe ich natürlich nicht, da inzwischen den Cache gesäubert (sonst immer da, diesmal -natürlich genau dann wenn ein Fehler auftritt- halt nicht). Welche logs/journals können wie durchsucht werden, wenn der Rechner spontan einfriert (passiert sowohl unter X11 als auch Wayland).

    • Martin-MS hat auf diesen Beitrag geantwortet.

      Berni341 Backups der alten Versionen der upgedateten Packages habe ich natürlich nicht, da inzwischen den Cache gesäubert

      Für solche Fälle gibt es das Arch Linux Archiv. Dort ist beschrieben wie man einzelne Pakete oder das gesamte System auf einen bestimmten Zeitpunkt zurücksetzen kann.
      Zur Zeit sind Probleme mit mesa bekannt, ein aktualisiertes Paket befindet sich zur Zeit noch in Extra-Testing.
      Der Dateisystemfehler scheint mir nach der Beschreibung eher ein Folgefehler des freeze zu sein, dass in dem Fall das Dateisystem nicht mehr aktualisiert werden kann.

      Gerade kamen neue Updates für den Kernel, mesa (2x in 24h) und vulkan-radeon (3x in 24h). Klingt nicht nach Zufall, evtl. liegt es daran, ich werde berichten. Bin kein zwanghafter Dauerupdater aber manchmal kommt vielleicht alles zusammen. Bin anscheinend nicht der einzige.

      Abschliessend: die Filesystem-Fehler waren bereits zuvor vorhanden bzw. kommen bei den Freezes neu aber können problemlos korrigiert werden, haben jedoch nichts mit den Freezes selbst zu tun, soweit ich sagen kann. Auch die Hardware wurde unter Linux und Windows gecheckt und scheint ok zu sein. Alles weitere in einem neuen Thema.