Problème aléatoire d'OS

Votre Apache se cache, votre Pi gémit, votre SoC fume ? La panne quoi ! C'est ici que vous trouverez sans doute une solution... Sinon du réconfort :)

Modérateurs : Francois, maxty01

Répondre
Jerome69
Messages : 22
Enregistré le : dim. 31 mai 2020 20:19

Problème aléatoire d'OS

Message par Jerome69 » mer. 13 sept. 2023 09:05

Bonjour à tous,

Je viens de rencontrer un problème pour la seconde fois (en plusieurs mois) : mon Raspberry semble "figé".

J'utilise DomoticZ avec Monit pour surveiller que tout fonctionne bien et hier DomoticZ n'était plus joignable.
J'ai tenté de me connecter sur l'interface de Monit, sans succès.
Ma box arrivait à voir le Raspberry sur le réseau via son interface.

Ce matin j'ai branché mon PC et j'ai réussi à pinger sans problème, mais toujours pas d'accès ni à DomoticZ ni à Monit.
L'accès en SSH n'était pas non plus possible.

J'avais ajouté un bouton sur le Raspberry afin de pouvoir l'allumer et l'éteindre proprement, mais cette fois, l'appui sur le bouton n'avait aucun effet.
J'ai dû l'arrêter en débranchant l'alim, n'ayant pas d'autre choix.

Ma question est de savoir si vous avez une idée de ce qui a pu se passer, et comment je peux faire pour qu'en automatique la box redémarre ou règle le problème via un script par exemple.
N'ayant aucune connexion sur le Raspberry, je ne sais pas si je peux ajouter une fonction à Monit car je ne sais pas si l'OS avait figé ou si cela vient d'autre chose.

Et je ne peux pas non plus reproduire le problème.

Pour info, j'utilise la version lite de Bullseye.

Merci d'avance pour votre aide.

piper
Raspinaute
Messages : 658
Enregistré le : sam. 5 juin 2021 18:57

Re: Problème aléatoire d'OS

Message par piper » mer. 13 sept. 2023 12:27

Même matériel, OS différent, même problème :
J'ai un Pi qui dispose d'un tuner TNT et diffuse avec tvheadend server la réception TNT sur le réseau : lui va très bien.
J'ai un autre pi sous LibreElec (Kodi) qui a le client tvheadend et affiche la TV

Si je regarde la TV avec ce dernier Pi, quelques fois (c'est rare mais cela arrive : 2 fois par mois) : il fige comme toi.
A partir de là, le service ssh (qui est activé) est injoignable, pourtant le pi reste pingable et il n'y a plus qu'une solution : débranché - rebranché le pi (j'ai aussi un bouton mais il utilise le gpio et un service donc une couche logicielle hors, l'OS est figé donc le bouton est inopérant)

J'ai beaucoup d'autres, beaucoup d'autres, Pi sans bureau (Bullseye Lite) , jamais il ne m'ont fait cela.

Autrement dit : mon avis, c'est que mon Kodi (ou LibreElec) a un gros bug sur l'affichage de la TV (cela ne se produit QUE si je regarde la TNT) et ton Domoticz (ou Monit) a surement un gros bug aussi.
Tu peux toujours vérifier ta carte SD (si tu en as une), moi pas, j'utilise un disque dur SSD que j'ai vérifié et qui n'a aucun soucis.
A moins que mon boitier USB qui contient le disque SSD ait un soucis (ce serait nouveau et il ne flancherait que si je regarde la TNT ?)
Tu peux aussi partir en enquête en suivant la santé des services, lire les logs, utiliser dmesg etc...

Un bon soft est un soft qui résiste à tout ce qui peut arriver (perte de réseau temporaire etc...) qui, à la limite plante en rendant la main mais qui ne doit pas figer l'OS ni ssh ni la couche réseau : ce serait incompatible avec l'esprit Linux (Le truc qu'on allume une fois et qui 15 ans plus tard tourne toujours, un jour, il tombe en panne après 15 ans de services. On se demande où se trouve physiquement le serveur; on suit les câbles et on le découvre oublié depuis 10 ans sous une couche de poussières incroyable dans un placard, loin des armoires sécurisées et protégées qu'on utilise depuis 10 ans, on le démonte, on retire la poussière et il repart : la carte mère l'avait éteint de crainte d'une surchauffe causée par la poussière ...... c'est du vécu en PME)
3 Pi4 : Emby / Samba , Librelec, Android TV
3 Pi3 : Hifiberry /OSMC, Games station, Samba / VPN / HotSpot Wifi
2 Pi2 : RFID, radio reveil (PiReveil)
1 Pi0 : traker GPS et acquisitions
1 Pi0 2W : tests divers
5 Arduinos dont 4 nanos et 1 Mega
1 ESP32

Jerome69
Messages : 22
Enregistré le : dim. 31 mai 2020 20:19

Re: Problème aléatoire d'OS

Message par Jerome69 » mer. 13 sept. 2023 13:53

Pareil, Bullseye lite, installé avec l'application RaspberryPi Imager.

Je viens de regarder les logs (que je mets en PJ pour les experts Linux), il semble que le Raspberry ai redémarré hier à 19h51 14 secondes. Je ne sais pas pourquoi, peut-être DomoticZ qui ne répondait plus et Monit a redémarré le Raspberry.
Il faudrait que je regarde, mais je ne crois pas avoir activé les logs pour Monit, afin de savoir s'il aurait pu redémarrer le boitier : Monit doit redémarrer l'application DomoticZ (ou Mosquitto) si elle plante, et si au bout de 3 fois ça ne marche toujours pas, il doit redémarrer le Raspberry.

J'ai des logs jusqu'à 19h51 42 secondes, et après plus rien jusqu'à ce matin 7h17 22 secondes, moment où je l'ai redémarré moi-même.

Si quelqu'un arrive à comprendre ce qu'il s'est passé...

Je vais peut-être tenter de mettre à jour, même si je ne pense pas que cela rentre en compte, sinon d'autres aurait le soucsi...
Fichiers joints
Log Raspberry.txt
(191.21 Kio) Téléchargé 61 fois

piper
Raspinaute
Messages : 658
Enregistré le : sam. 5 juin 2021 18:57

Re: Problème aléatoire d'OS

Message par piper » sam. 16 sept. 2023 08:37

Tu as 2 occurrences ou sont traités :
- le lancement du service fsckd (qui regarde si faut lancer un check des fichiers sur le support de l'OS, chez toi, surement une SD CARD)
- Suivit de timesyncd (service de synchronisation du temps)

Dans le 2ième cas, on voit que fsckd a duré 1 minute environ (de 07:18:11 à 07:19:16)
Et dans le 1er cas, fsckd a duré environ 10 heures (de 19:51:42 à 07:17:22)

Ca sent le système de fichiers abimé et un long traitement de réparation

A noter : pour que fsck puisse travailler, le système de fichier ne doit pas être monté, donc quand fsck trouve des erreurs et effectue des corrections, il ne peut rien écrire : donc pas de log détaillée de son travail
3 Pi4 : Emby / Samba , Librelec, Android TV
3 Pi3 : Hifiberry /OSMC, Games station, Samba / VPN / HotSpot Wifi
2 Pi2 : RFID, radio reveil (PiReveil)
1 Pi0 : traker GPS et acquisitions
1 Pi0 2W : tests divers
5 Arduinos dont 4 nanos et 1 Mega
1 ESP32

Jerome69
Messages : 22
Enregistré le : dim. 31 mai 2020 20:19

Re: Problème aléatoire d'OS

Message par Jerome69 » lun. 18 sept. 2023 15:21

Ok je viens de voir.

Mon OS tourne sur une clé USB, il faut donc que je la vérifie.

J'ai trouvé des commandes pour le faire sous Linux (je suis sous Windows moi).
Il faut que je me fasse un liveCD avec accès réseau pour faire les tests.
En espérant que la clé ne soit pas HS.

Il y a la possibilité d'envoyer une notification ou un mail ou programmer un reboot pour annuler le check s'il est trop long?
Ou alors même le désactiver au démarrage du RaspBerry...

piper
Raspinaute
Messages : 658
Enregistré le : sam. 5 juin 2021 18:57

Re: Problème aléatoire d'OS

Message par piper » lun. 18 sept. 2023 16:46

Si tu as un PC avec un lecteur de DVD et un peu de patience, tu peux effectivement te faire un live CD d'un Linux (Fedora ou Debian ou Ubuntu, ce que tu veux)
Tu fais booter son PC dessus (ce sera plus long qu'un démarrage à partir d'un disque dur car un CD ou DVD a un temps d'accès hyper long à côté d'un disque dur même mécanique)

Soit tu passes par un terminal pour lacer les commandes que tu as identifiées, soit tu utilises le mode graphique

Car une fois démarré, tu arrives sur un bureau Linux (mois je suis un fan de Fedora associé à Cinnamon ou Gnome)
Fedora Live (mais normalement les autres aussi) mettent à disposition un minimum d'outils dont l'un est "Disques" ou "Gnome-Disks"
"Disques" te permet de sélectionner un disque, supprimer une partition, en créer, monter démonter un disque, consulter les données de santé du disque (Smart disk), tester les performances (débits) et vérifier un système de fichier.
Et tout ça avec ta souris, sans une seule ligne de commande.

Le bouton "play" sert à monter une partition, une fois montée, play se tranforme en bouton "Stop" pour la démonter
Si elle est démontée, dans le menu accessible par la roue crantée , tu a accès à la fonction "vérifier le système de fichiers" (ou par un clic droit sur la partition)
Image

Image
3 Pi4 : Emby / Samba , Librelec, Android TV
3 Pi3 : Hifiberry /OSMC, Games station, Samba / VPN / HotSpot Wifi
2 Pi2 : RFID, radio reveil (PiReveil)
1 Pi0 : traker GPS et acquisitions
1 Pi0 2W : tests divers
5 Arduinos dont 4 nanos et 1 Mega
1 ESP32

Répondre

Retourner vers « En panne ? »