RevPi Connect+ Power LED blinkt/flackert rot - keine Verbindung mehr möglich
Posted: 09 Sep 2020, 20:09
Hallo Forum,
ich habe einen RevolutionPi Connect+ 8GB welcher über das bei Kunbus verfügbare Hutschienen Schaltnetzteil angeschlossen ist. Erweitert wurde das Gerät mit einem DATA IO und mit einem CAN Modul.
Das System läuft seit etwa 3-4 Monaten kontinuierlich und zuverlässig durch. Es gab nur sehr wenige und kleinere Softwareupdates. Vor etwa 2 Wochen war das System nicht mehr erreichbar. Soweit ich mich erinnere hat
am RevPi Connect+ die Power LED rot geblinkt. Ich habe das System stromlos geschaltet, wieder gestartet und dann lief es wieder einwandfrei. Eine erste Analyse lies vermuten, dass der Datenbank Prozess "heißgelaufen" ist, da mittlerweile 500MB Daten aufgelaufen sind und der Datenbankprozess fast 2 Kerne vollständig ausgelastet hat. Ich habe die Datenbank gelöscht, CPU war danach wieder am "idlen". Heute (2Wochen später) war das System schon wieder nicht mehr erreichbar. Die Power LED hat sehr unregelmässig rot geblinkt, ich möchte fast sagen "geflackert". Zusätzlich waren die LEDs A1 und A2 grün (nicht von mir geschaltet).
System stromlos geschaltet, wieder hochgefahren und nun läuft alles wieder (auch ohne merkliche CPU Last), aber:
Wieso stürzt der RevPi nach 3-4 Monaten 2 mal innerhalb von 2 Wochen ab? Warum blinkt die Power LED rot? Wie kann ich herausbekommen, was da passiert ist? Die Dokumentation schweigt dazu. Die Power LED vom DIO Modul war grün. Die Logfiles zum entsprechenden Zeitpunkt helfen nicht weiter. Das System ist ein Testsystem ohne Watchdog (der wird im Produktivbetrieb aktiviert). Trotzdem würde ich gerne herausbekommen, was dort passiert ist, denn eine Hardware die schon nach 3 Monaten abstürzt ist für meinen Anwendungsfall kritisch zu betrachten.
Das Flash des Systems wurde sehr freizügig vollgeschrieben. Im System sind derzeit noch 2GB frei, dennoch dürfte ich insgesamt schon 8GB vollgeschrieben haben. Meine Befürchtung ist, dass es sich hier um einen Kernel-Flashfehler handeln könnte. Vermutung: In den ersten Monaten hat der Kernel mit einem leeren Flash arbeiten können. Mittlerweile muss er Flashsektoren löschen bevor er schreibend darauf zugreifen kann. Gibt es Erfahrungswerte dazu?
Vielen Dank!
Systemkonfiguration:
Raspbian Stretch, aktueller Updatestand, Linux emibox0001 4.19.95-rt38-v7+ #1 SMP PREEMPT RT Tue, 16 Jun 2020 13:25:43 +0200 armv7l GNU/Linux
ich habe einen RevolutionPi Connect+ 8GB welcher über das bei Kunbus verfügbare Hutschienen Schaltnetzteil angeschlossen ist. Erweitert wurde das Gerät mit einem DATA IO und mit einem CAN Modul.
Das System läuft seit etwa 3-4 Monaten kontinuierlich und zuverlässig durch. Es gab nur sehr wenige und kleinere Softwareupdates. Vor etwa 2 Wochen war das System nicht mehr erreichbar. Soweit ich mich erinnere hat
am RevPi Connect+ die Power LED rot geblinkt. Ich habe das System stromlos geschaltet, wieder gestartet und dann lief es wieder einwandfrei. Eine erste Analyse lies vermuten, dass der Datenbank Prozess "heißgelaufen" ist, da mittlerweile 500MB Daten aufgelaufen sind und der Datenbankprozess fast 2 Kerne vollständig ausgelastet hat. Ich habe die Datenbank gelöscht, CPU war danach wieder am "idlen". Heute (2Wochen später) war das System schon wieder nicht mehr erreichbar. Die Power LED hat sehr unregelmässig rot geblinkt, ich möchte fast sagen "geflackert". Zusätzlich waren die LEDs A1 und A2 grün (nicht von mir geschaltet).
System stromlos geschaltet, wieder hochgefahren und nun läuft alles wieder (auch ohne merkliche CPU Last), aber:
Wieso stürzt der RevPi nach 3-4 Monaten 2 mal innerhalb von 2 Wochen ab? Warum blinkt die Power LED rot? Wie kann ich herausbekommen, was da passiert ist? Die Dokumentation schweigt dazu. Die Power LED vom DIO Modul war grün. Die Logfiles zum entsprechenden Zeitpunkt helfen nicht weiter. Das System ist ein Testsystem ohne Watchdog (der wird im Produktivbetrieb aktiviert). Trotzdem würde ich gerne herausbekommen, was dort passiert ist, denn eine Hardware die schon nach 3 Monaten abstürzt ist für meinen Anwendungsfall kritisch zu betrachten.
Das Flash des Systems wurde sehr freizügig vollgeschrieben. Im System sind derzeit noch 2GB frei, dennoch dürfte ich insgesamt schon 8GB vollgeschrieben haben. Meine Befürchtung ist, dass es sich hier um einen Kernel-Flashfehler handeln könnte. Vermutung: In den ersten Monaten hat der Kernel mit einem leeren Flash arbeiten können. Mittlerweile muss er Flashsektoren löschen bevor er schreibend darauf zugreifen kann. Gibt es Erfahrungswerte dazu?
Vielen Dank!
Systemkonfiguration:
Raspbian Stretch, aktueller Updatestand, Linux emibox0001 4.19.95-rt38-v7+ #1 SMP PREEMPT RT Tue, 16 Jun 2020 13:25:43 +0200 armv7l GNU/Linux