Hallo zusammen,
nach einem Kernel Update wird bei mir die Temperatur von den Laufwerken nicht mehr ausgelesen.
Mit Kernel 6.10.2.arch1-2 hat es noch funktioniert.

$ hddtemp /dev/sda
/dev/sda: Samsung SSD 850 EVO 250GB �@: drive is sleeping

Unter gnome-disk-utility fehlt auch eine komplette Zeile.

Kernel 6.10.2.arch1-2

6.10.3-arch1-2

Ich kann das zumindest bestätigen.
Selbst bei mir mit dem zen-Kernel, auch der Unterschied zwischen 6.10.2 und 6.10.3

Kurz probiert:

  • Neubauen vom Paket hddtemp: Keine Änderung
  • smartctl zeigt weiterhin die Temperaturen an.
  • inxi (was eine optionale Abhängigkeit zu hddtemp hat) verhält sich so:
    inxi -xD zeigt keine Temp mehr an (habe ich unter 6.10.2 nicht getestet)
    In der Hilfe zu inxi wird erwähnt, daß zur Temp-Anzeige entweder die "alte" Methode hddtemp oder (neuer) das Kernelmodul drivetemp verwendet wird.
    Lade ich drivetemp (modprobe drivetemp) zeigt inxi -xD wieder die Temps an.

Ein funktionierendes hddtemp wird optional benötigt eben z.B. von inxi als auch von sensors-applet. Letzteres bringt wohl bei dir dann auch die unterschiedlichen Angaben im Gnome-Dialog.
Was du bitte testen könntest wäre: lade das Kernelmodul drivetemp, beende und starte Gnome neu und schau mal, ob sensors-applet ggf. auch das Kernelmodul nutzt, du also die Temp-Anzeige wieder siehst.

hddtemp ist AFAIK ja ein Paket mit sehr "altem" Sourcecode. Zwischen 10.2 und 10.3 gab es nun wohl eine Änderung, die das bisherige Funktionieren von hddtemp verhindert. Also eine Regression, die entweder auf einem "schlechten" Commit herrührt oder von einer bewußten Änderung, nach der ggf. Sourcecode der Programme angepaßt werden müssten. Also Bug oder Feature... ;-)

Um das rauszufinden müßte man wohl den Kernel bisecten.
Und/oder einen Bugreport zu extra/hddtemp erstellen, in der Hoffnung daß - wenn ein Feature im Kernel - der/die Authors den Sourcecode anpassen/patchen können.

Ich selbst habe aktuell keine Zeit für einen Bisect. Ich schau nochmal ob ein strace ggf. für Erhellung sorgen kann...

//Edit: strace
Also es dürfte hier passieren:

ioctl(3, HDIO_GET_IDENTITY, "@\0\377?7\310\20\0\0\0\0\0?\0\0\0\0\0\0\0001915E1F93487"...) = 0
ioctl(3, HDIO_DRIVE_CMD, {command=ATA_CMD_CHK_POWER, sector_number=0, feature=0, sector_count=0} => {status=0xe5, error=0, nsector=0}) = 0

status=0xe5 ist (vermute ich) der Indikator daß das Drive (fälschlicherweise) im Sleep-Modus wäre. Falls du den 6.10.2 gerade aktiv hast, dann teste doch bitte mal, ob unter dem funktionierendem hddtemp ein anderer status= ausgegeben wird:
strace hddtemp /dev/sda]

//Edit:
Das ist wohl eine Kernel-Regression, und für ein anderes Tool (hdparm) wohl ebenfalls bekannt/gemeldet.
Ich hatte mich am kernel bisecting versucht und bin dabei auf Probleme gestoßen.
Dann habe ich im englischen Forum "um Hilfe" gerufen, und das Ergebnis ist das der user gromit
a) einen schon bestehenden Report zu hdparm gefunden hatte, der wohl auch für das hddtemp Problem verantwortlich ist (inkl. dem wahrscheinlichen BAD commit) und
b) er dein/unser Problem dort freundlicherweise an den bestehenden Thread auf der Linux kernel mailingliste angehängt hat. Hier ist der Link dazu:
https://lore.kernel.org/all/df43ed14-9762-4193-990a-daec1a320288@heusel.eu/

Link zu meinem Post im .org-Forum:
https://bbs.archlinux.org/viewtopic.php?id=298407

Keine Ahnung ob das jetzt hilft, mit # hddtemp -w /dev/sda bekommt man schon wieder die Temperatur angezeigt

  • GerBra hat auf diesen Beitrag geantwortet.

    Andy@Arch hddtemp -w

    Stimmt, das initiert wohl eine WAKE eben für ein Drive was gar nicht "schläft".
    Ist aber nur ein Workaround wenn direkt mit hddtemp gearbeitet wird. Andere Programme, die auch hddtemp nutzen, starten ja diesen Parameter nicht.

    Und es ist trotzdem noch was im "Argen" mit -w:
    In die Ausgabe "mogelt" sich immer noch ein Rest der "falschen" Abfrage rein, dieser "@:" gehört da nicht rein. Im Hex sieht das so aus:

    0000060  20  20  01  80  01  40  3a  20  33  31  c2  b0  43  0a
             sp  sp soh nul soh   @   :  sp   3   1   B   0   C  nl

    für den Teil vor der Grad-Anzeige.

    Und abgesehen davon, daß eben auch andere bestehende Userspace-Tools betroffen sind.

    Ich finde die Diskussion auf der LKML halt auch interessant, wohin geht die "Reise"?

    Sagen die Kernel-Devs: wir sind aktuell vollkommen zufrieden mit dem Stand im aktuellen ATA(-IO) Baum, soll doch der Userspace sehen wie er zurechtkommt und Sourcecode "an uns" anpasst.
    Oder wird es einen Zustand geben, in dem im Kernel-Tree Codeänderungen vorgenommen werden, damit die Userspace-Tools wieder laufen. Ggf. eine zeitlich begrenzte Codeänderung.

    Ich lese hier die HDD-Temparatur über "/sys/class/hwmon/hwmon?/?" aus, kommen dort die Werte von hddtemp? Oder wäre das eine alternative für die Userspace-Tools?

    10 Tage später

    Der Temperatur-Bug ist mit dem Kernel 6.10.6 behoben.
    Danke