wobo
Habe ein aktuelles ArchLinux auf 32-Bit-System inklusive proprietärem NVIDIA.
Heute friert mir mitten im Betrieb ohne eine Aktivität meinerseits das komplette System so ein, dass weder Eingabegeräte (Tastatur, Maus) noch ssh von einem anderen Rechner des Netzwerks funktionieren.
Aktuell lief:
KDE
gkrellm (mit normaler CPU-Auslastung und normalen Temperaturwerten für CPU und Grafik)
gftp mit einem Download einer DVD-ISO. Download lief auf vollen Touren (660KByte/s). Ich war an einem anderen Rechner beschäftigt. Screensaver und/oder Sparmodi waren ausgeschaltet.
Plötzlich stand alles still. Der Router versuchte noch, Pakete zum Rechner zu schicken, die aber nicht mehr angenommen wurden. Auch ein 'ssh desk_arch' von einem anderen Rechner meldete nach entsprechender Zeit ein Timeout.
Die einzige Option, weiterzumachen, war der Powerknopf: Ausschalten, wieder einschalten.
Nach dem Neustart fährt das System normal hoch, liest das RecoveryJournal ein, alles normal.
Weder im syslog noch irgendwo sonst ist eine Spur des Vorgangs zu finden.
wobo
wobo
Noch ein Hinweis:
Ich hatte bisher an diesem Rechner keinerlei Ausfälle im Betrieb, lediglich ab und zu ein Einfrieren während des Schlafmodus, d.h., es kam kein Grafiksignal mehr an den Monitor, das System wachte nicht auf (es ließ sich auch nicht blind herunterfahren).
wobo
Pierre
Ist das bisher nur einmal aufgetreten? Wenn es nicht reproduzierbar ist, wird es schwierig das Problem zu lokalisieren. Mein Verdacht würde zuerst auf X und den nvidia-Treiber fallen.
Natürlich kann es auch die Hardware sein. Aber zunächst würde ich es nur weiter beobachten, ob das Problem nochmal auftritt.
Das Rechner mit Suspend Probleme haben ist eigentlich der Normalfall. Es gab einen interessanten Vortrag auf der FOSDEM (Video) dazu. Kurz: Suspend kann nicht funktionieren. Zumindest nicht so, wie es aktuell implementiert ist.
Army
Ist mir in letzter Zeit auch bissl häufiger passiert als sonst. Ich hab den freien Radeon laufen. Wenn es wieder passiert, schau ich mal in die logs rein, hatte in dem Moment nie Gelegenheit dazu. Ist mir jedes Mal passiert, als ich über USB größere Datenmengen verschoben hab, also auf externe Platte und meinen ogg-Player (der auch mp3 kann 😛 ).
jean-paul
Bei einmaligem Auftreten des Problems würde ich mal ein "verrutschtes" Bit verantwortlich machen.
Wenn es mehrfach Auftritt könnte es Hardware sein.
Jean-Paul
Army
Könnt auch der Arbeitsspeicher sein, oder? Wenn ja, dann lass ich heut Nacht mal den memtest Test durchlaufen.
Kromonos
wobo schrieb
Habe ein aktuelles ArchLinux auf 32-Bit-System inklusive proprietärem NVIDIA.
Heute friert mir mitten im Betrieb ohne eine Aktivität meinerseits das komplette System so ein, dass weder Eingabegeräte (Tastatur, Maus) noch ssh von einem anderen Rechner des Netzwerks funktionieren.
Aktuell lief:
KDE
gkrellm (mit normaler CPU-Auslastung und normalen Temperaturwerten für CPU und Grafik)
gftp mit einem Download einer DVD-ISO. Download lief auf vollen Touren (660KByte/s). Ich war an einem anderen Rechner beschäftigt. Screensaver und/oder Sparmodi waren ausgeschaltet.
Plötzlich stand alles still. Der Router versuchte noch, Pakete zum Rechner zu schicken, die aber nicht mehr angenommen wurden. Auch ein 'ssh desk_arch' von einem anderen Rechner meldete nach entsprechender Zeit ein Timeout.
Die einzige Option, weiterzumachen, war der Powerknopf: Ausschalten, wieder einschalten.
Nach dem Neustart fährt das System normal hoch, liest das RecoveryJournal ein, alles normal.
Weder im syslog noch irgendwo sonst ist eine Spur des Vorgangs zu finden.
wobo
Das gleiche problem hab ich auch. Einen Memtest habsch auch schon durchlaufen lassen und der viel positiv aus. An den RAMs scheint es also nicht zu liegen 🙁 Die "Abstürtze" passieren unwillkürlich.
Reproduzieren konnte ich das bisher leider nicht ...
EDIT: Das verhalten zeigte sich auf einem 32Bit, sowie auf einem 64Bit System. Ob es nach einer frischen Installation das Problem ebenfalls auftritt kann ich leider nicht sagen, weil ich bisher nach der Installation immer direkt ein pacman -Syu gemacht hab zum updaten.
blixawillbargeld
selbes problem hier auf meinem laptop....hab auch den freien radeon treiber laufen...32 bit system und ein athlon 64 xp....auf einmal bleibt x hängen...keine tastatureingaben gehen mehr und gar nix.....passiert selten aber doch!
doc.horn
Leider muss ich mich da einreihen:
Ist mir jetzt schon ein paar mal passiert in den letzten Tagen. Reproduzierbar ist das nicht, der Rechner freezed aber vor allem gerne wenn er nichts zu tun hat.
Das erste Mal hatte ich den Fehler, als ich zwei verschiedene USB-Wifi-Sticks am Rechner installiert hatte, um diese zu vergleichen. Gestern und heute war jeweils eine externe USB-Platte am Rechner. In Zusammenhang mit den ständigen Kernel-Meldungen "cannot enumerate usb device xx" beim Boot tippe ich da mal auf die USB Schnittstelle als Ursache.
In den logs findet sich rein garnichts.
Unter WinXP habe ich diese Probleme übrigens noch nie gehabt.
System:
Archlinux 32bit, aktueller Stand
nvidia-closed-source-Treiber
Gnome mit Compiz Fusion
Bomb@
HI,
aufm Laptop mit freien ATI-Treibern hab ich in den letzten 2 Tagen 4 Freezes gehabt.
Weis noch nicht worans liegt. Habe aber die Vermutung das es an KDE / XORG liegt (einzige was ich die letzten Tage geupdatet habe). Davor nie Stress damit gehabt.
CPU: Penitum-M 32bit.
1gb RAM (ist getestet)
Arch-Testing.
Aufm "Server", 64bit Arch Testing, läuft wiederrum alles mehr als Rund.
Grüßle
doc.horn
Ich bin mir nicht 100%ig sicher, glaube aber, dass der Spass erst mit Kernel 2.6.25 angefangen hat. In Verbindung mit den proprietären nvidia-Treibern gibts auch in vielen Foren Meldungen von ähnlichen Probs. Da aber hier einige auch die ATI-Treiber verwenden, liegt es vielleicht am Kernel selber.
Ich hab schon überlegt, ob ich einfach mal downgraden soll, um es zu testen...
Teyro
Hiho!
Also ich habe exakt das selbe Problem wie die anderen User über mir!
Mal passiert es beim Zocken (Savage 2) mal beim Tippen in OpenOffice (extremst Ärgerlich) und naja auch im DVB schauen mit Kaffeeine....
Ichg kann diese Theorie zu teilen bestätigen..... Also dieser Fehler tritt erst mit Kernel 2.6.25 auf 😉 Ich dachte ich hatte mir das nur eingebildet aber das scheint ja real zu sein!
Also bisher trat dieser Fehler nicht reproduziuerbar auf... Allerdings sehr häufig beim Einstecken von Speichkarten oder wenn Schreiboptionen auf die HHD / Speicherkarte ausgführt wird....
Hier mal meine System Konfiguration: Intel Core2Dou @ 1.86GHZ , Asus P5B, 2 GB DDR2 Ram, Samsung SATA2 HDD, Soundblaster Live 5.1 PCI, Hauppauge WinTV Nova
Kernel 2.6.25 @ KDEMod
Gruß aus Hamburg
eiffel56
Heyho,
bei mir ist Arch noch überhaupt nie abgestürzt oder gefreezed oder dergleichen, aber von nem Freund habe ich auch schon gehört das es bei ihm 1-2 mal passiert ist.
Was habt ihr denn so für Hardware? Board etc.. Benutzt ihr USB Hubs(bei denen wo das System freezed wenn viel über USB geht)? USB Hubs sind schon seit einigen Jahren absolute Billigware, und die dort verbauten Chips sind der letzte Müll. Wenn man da nich aufpasst hat man ganz schnell son Gerät an der Backe. Habt ihr eventuell zusätzliche USB Steckkarten? Da zeichnet sich das gleiche Bild ab.
Solange ihr den USB Kram allerdings nicht fest eincompiliert habt sollte schlimmstenfalls nur der USB Kram sich verabschieden, in den meisten Fällen läuft das restliche System unbeeindruckt weiter. Ihr könnt ja mal mit dd nen bisschen Last auf nem USB Datenträger erzeugen und ins dmesg schauen.
In den meisten Fällen sind freezes auf die Hardware zurückzuführen. Bei Windows Treibern wird deswegen zum Beispiel die Datenrate künstlich beschränkt, so das das Problem nicht auftritt. Linux Treiber tun das in der Regel nicht.
blind
Also ich hab solche System-Freezes bei denen dann gar nichts mehr geht, seit Kernel 2.6.23 (seitdem nutz ich arch). Die Freezes treten in Unregelmässigen Abständen auf, und scheinbar immer wenn ich fleissig aufs Netzwerk zugreife.
Die Geschwindigkeit spielt offenbar keine Rolle, eher dass es kontinuierlicher Datenstrom stattfindet. (auch schon beim Zatto schaun passiert). Zudem hatte ich noch nie Probleme wenn ich über Nacht was gezogen hab, sondern immer wenn ich nebenzu noch gearbeitet hab. Aber eben nie wenn ich nur gearbeitet hab.
Bei dem System handelt es sich um:
lspci
00:00.0 RAM memory: nVidia Corporation Unknown device 0547 (rev a2)
00:01.0 ISA bridge: nVidia Corporation Unknown device 0548 (rev a2)
00:01.1 SMBus: nVidia Corporation Unknown device 0542 (rev a2)
00:02.0 USB Controller: nVidia Corporation MCP67 OHCI USB 1.1 Controller (rev a2)
00:02.1 USB Controller: nVidia Corporation MCP67 EHCI USB 2.0 Controller (rev a2)
00:04.0 USB Controller: nVidia Corporation MCP67 OHCI USB 1.1 Controller (rev a2)
00:04.1 USB Controller: nVidia Corporation MCP67 EHCI USB 2.0 Controller (rev a2)
00:06.0 IDE interface: nVidia Corporation MCP67 IDE Controller (rev a1)
00:07.0 Audio device: nVidia Corporation MCP67 High Definition Audio (rev a1)
00:08.0 PCI bridge: nVidia Corporation Unknown device 0561 (rev a2)
00:09.0 IDE interface: nVidia Corporation Unknown device 0550 (rev a2)
00:0a.0 Ethernet controller: nVidia Corporation Unknown device 054c (rev a2)
00:0b.0 PCI bridge: nVidia Corporation Unknown device 0562 (rev a2)
00:0c.0 PCI bridge: nVidia Corporation Unknown device 0563 (rev a2)
00:0d.0 PCI bridge: nVidia Corporation Unknown device 0563 (rev a2)
00:0e.0 PCI bridge: nVidia Corporation Unknown device 0563 (rev a2)
00:0f.0 PCI bridge: nVidia Corporation Unknown device 0563 (rev a2)
00:10.0 PCI bridge: nVidia Corporation Unknown device 0563 (rev a2)
00:11.0 PCI bridge: nVidia Corporation Unknown device 0563 (rev a2)
00:12.0 VGA compatible controller: nVidia Corporation Unknown device 053b (rev a2)
00:18.0 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] HyperTransport Technology Configuration
00:18.1 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] Address Map
00:18.2 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] DRAM Controller
00:18.3 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] Miscellaneous Control
lsusb
Bus 004 Device 001: ID 1d6b:0002
Bus 002 Device 001: ID 1d6b:0001
Bus 003 Device 004: ID 04d9:0420 Holtek Semiconductor, Inc.
Bus 003 Device 003: ID 04f9:0027 Brother Industries, Ltd
Bus 003 Device 002: ID 05e3:0606 Genesys Logic, Inc. D-Link DUB-H4 USB 2.0 Hub
Bus 003 Device 001: ID 1d6b:0002
Bus 001 Device 001: ID 1d6b:0001
uname -all
Linux xxxxxx 2.6.25-ARCH #1 SMP PREEMPT Fri May 16 14:29:57 CEST 2008 x86_64 AMD Athlon(tm) 64 X2 Dual Core Processor 4000+ AuthenticAMD GNU/Linux
Da ich keine Dokumentation und keine sichere eingrenzung auf den Fehler treffen kann, weiß ich leider auch nicht wie ich da herangehen soll. Wen jemand ne Idee hat.. Ich bin für Vorschläge offen 🙂
mfg blind
videoneu100
doc.horn schrieb
Ich bin mir nicht 100%ig sicher, glaube aber, dass der Spass erst mit Kernel 2.6.25 angefangen hat.
kannst du dir 100% sicher sein. 🙂
doc.horn schrieb
In Verbindung mit den proprietären nvidia-Treibern gibts auch in vielen Foren Meldungen von ähnlichen Probs.
deswegen benutze ich Kernel 2.6.24 (selbst gebacken)
Ich hab schon überlegt, ob ich einfach mal downgraden soll, um es zu testen...
wo du auch erfolg haben wirst bzw. keine Probleme mehr.
es scheint mit Kernel 2.6.25 erstes mal alles zu laufen bzw. man merkt nichts von der Problematik, erst mit der zeit wird man feststellen das der Kernel 2.6.25 nicht nur mit NVIDIA Probleme macht, sondern auch mit Intel Treiber und viel mehr...
was ich auch festgestellt habe;
NVIDIA GraKa ist um ca. 10% langsamer mit Kernel 2.6.25
Ich nutze jetzt Kernel 2.6.24 und habe gar keine Abstürze oder irgendwelche Hänger...
[gelöscht]
Hallo,
ich hatte das Absturzproblem auch (nvidia,xfce4,firefox/thunderbird/pidgin).
Bei mir wars letztendlich der Onboard-Netzwerkadapter (den ich dann im BIOS abgeschaltet hab)!
=> "Mein Computer stürzt ab" kann wirklich jede erdenkliche Ursache haben!
eiffel56
Mmhhh. vielleicht ist ein Fehler im Paket? Meinen Kernel compiliere ich mir aus einer kleinen Notwendigkeit raus immer selbst, vielleicht tritt es deswegen nicht auf?
Irgendwie muss man ja den Fehler eingrenzen, kann ja nich sein das einfach 2.6.25 kaputt ist. Was habtn ihr für Chipsätze und so? RAM? Der ganze Kram halt. Vielleicht habt ihr alle zufällig das gleiche Board oder den gleichen Chipsatz, und für den Chipsatz hat der Treiber ne Macke.
Deswegen frage ich nach den ganzen Details.
Wie gesagt, hier läuft das System total stabil. Keinen Aussetzer in der ganzen Zeit seit ich Arch benutze gehabt. Und darüber bin ich echt froh, solche random freezes sind total fies :/.
Übrigens ist bei mir die Performance mit meiner NVidia Karte bei 2.6.25 sogar ein bisschen gestiegen(ca 100fps in glxgears, nichts was man groß merken würde).
GerBra
videoneu100 schrieb
es scheint mit Kernel 2.6.25 erstes mal alles zu laufen bzw. man merkt nichts von der Problematik, erst mit der zeit wird man feststellen das der Kernel 2.6.25 nicht nur mit NVIDIA Probleme macht, sondern auch mit Intel Treiber und viel mehr...
Erzähl das bitte nicht meinen Rechner 😉
Nein, im Ernst: ich wette das du eine solch pauschale Aussage nicht belegen kannst
(Bugreports, LKML-Beiträge, ...)
Früher[tm] hat man gesagt: Wenn bei Linux stabil läuft, dann ist deine Hardware ok.
Das trifft sicher immer noch zu und kann sich auch von Kernel-Version "dramatischer"
auswirken, wenn Code strikter, weniger toleranter programmiert wird.
Ich denke, wir sollten mal mit einer Wiki-Seite anfangen zum Komplex "Abstürze". Ich
werde mich heute Mittag mal dranmachen:
Kurze Stichpunkte:
- Macht eure Rechner innen sauber, v.a. im Sommer die Wollmäuse von den Lüftern entfernen.
- Karte (v.a. AGP auf Sitz überprüfen, rausnehmen und wieder einsetzen)
- Ein XServer ist nicht Linux, sondern nur eine Anwendung (kommt man also an den Rechner noch ran: SysReq (siehe schon im Wiki), übers Netz(ssh), über eine serielle Schnittstelle.
- Logfiles: sind Kernelpanic-Meldungen zu finden
- Nützliche Kernel-Parameter
- Testprogramme um die "Abstürze" wenn möglich reproduzieren zu können
- Kerneldumps
videoneu100
Hallo GraBra,
ich wette das du eine solch pauschale Aussage nicht belegen kannst
(Bugreports, LKML-Beiträge, ...)
Ich meine auch das im ernst 🙂 bzw. bei mir mit:
00:00.0 Host bridge: Intel Corporation Mobile PM965/GM965/GL960 Memory Controller Hub (rev 03)
00:01.0 PCI bridge: Intel Corporation Mobile PM965/GM965/GL960 PCI Express Root Port (rev 03)
00:1a.0 USB Controller: Intel Corporation 82801H (ICH8 Family) USB UHCI Contoller #4 (rev 03)
00:1a.1 USB Controller: Intel Corporation 82801H (ICH8 Family) USB UHCI Controller #5 (rev 03)
00:1a.7 USB Controller: Intel Corporation 82801H (ICH8 Family) USB2 EHCI Controller #2 (rev 03)
00:1b.0 Audio device: Intel Corporation 82801H (ICH8 Family) HD Audio Controller (rev 03)
00:1c.0 PCI bridge: Intel Corporation 82801H (ICH8 Family) PCI Express Port 1 (rev 03)
00:1c.1 PCI bridge: Intel Corporation 82801H (ICH8 Family) PCI Express Port 2 (rev 03)
00:1c.3 PCI bridge: Intel Corporation 82801H (ICH8 Family) PCI Express Port 4 (rev 03)
00:1c.5 PCI bridge: Intel Corporation 82801H (ICH8 Family) PCI Express Port 6 (rev 03)
00:1d.0 USB Controller: Intel Corporation 82801H (ICH8 Family) USB UHCI Controller #1 (rev 03)
00:1d.1 USB Controller: Intel Corporation 82801H (ICH8 Family) USB UHCI Controller #2 (rev 03)
00:1d.2 USB Controller: Intel Corporation 82801H (ICH8 Family) USB UHCI Controller #3 (rev 03)
00:1d.7 USB Controller: Intel Corporation 82801H (ICH8 Family) USB2 EHCI Controller #1 (rev 03)
00:1e.0 PCI bridge: Intel Corporation 82801 Mobile PCI Bridge (rev f3)
00:1f.0 ISA bridge: Intel Corporation 82801HEM (ICH8M) LPC Interface Controller (rev 03)
00:1f.1 IDE interface: Intel Corporation 82801HBM/HEM (ICH8M/ICH8M-E) IDE Controller (rev 03)
00:1f.2 SATA controller: Intel Corporation 82801HBM/HEM (ICH8M/ICH8M-E) SATA AHCI Controller (rev 03)
00:1f.3 SMBus: Intel Corporation 82801H (ICH8 Family) SMBus Controller (rev 03)
01:00.0 VGA compatible controller: nVidia Corporation GeForce 8600M GT (rev a1)
04:00.0 Memory controller: Intel Corporation Turbo Memory Controller (rev 01)
06:00.0 Network controller: Intel Corporation PRO/Wireless 4965 AG or AGN Network Connection (rev 61)
08:00.0 Ethernet controller: Broadcom Corporation NetLink BCM5787M Gigabit Ethernet PCI Express (rev 02)
0a:09.0 FireWire (IEEE 1394): Ricoh Co Ltd R5C832 IEEE 1394 Controller (rev 05)
0a:09.1 SD Host controller: Ricoh Co Ltd R5C822 SD/SDIO/MMC/MS/MSPro Host Adapter (rev 22)
0a:09.2 System peripheral: Ricoh Co Ltd R5C843 MMC Host Controller (rev 12)
0a:09.3 System peripheral: Ricoh Co Ltd R5C592 Memory Stick Bus Host Adapter (rev 12)
0a:09.4 System peripheral: Ricoh Co Ltd xD-Picture Card Controller (rev 12)
also, Intel und nvidia, was Problemlos mit Kernel 2.6.24 läuft aber, mit Kernel 2.6.25 nicht so. (Alsa und Nvidia Probleme führt zu instabilen system...)
anscheid bin ich auch nicht der einzige:
Siehe:
"Nabend, musste gerade feststellen das der Sound bei meinem Extens 5220 (HDA ALC268) nicht mehr geht. Module und alles werden ordnungsgemäß geladen aber es kommt nix mehr raus, egal aus welchem Ausgang. Sind da irgendwelche Probleme mit dem Sound und dem 2.6.25 schon bekannt?"
Link:
http://www.pro-linux.de/news/2008/12577.html
fast das gleiche Problem habe ich auch, nur das bei mir manchmal der Ton geht...
das Problem dabei ist, das dmesg oder /var/log/messages nichts verdächtiges anzeigt 🙁
es ist aber immer so im Linux-Welt gewesen, bei manche läuft der Kernel ?.?.? besser als der Kernel ?.?.? (das weist du aber besser... 😉 )
Gruss
doc.horn
So, ich hab jetzt mal nen Downgrade auf kernel 2.6.24-4 gemacht (31. März bei mir)
bis jetzt läufts ganz gut. Schauen wir mal ob
1. die Freezes jetzt genauso häufig vorkommen wie sonst, nämlich gar nicht
2. ich beim Downgrade alles richtig gemacht hab. 😉