Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 18/12/2018, à 15:30

ewok2

Debug d'un Ubuntu qui se bloque avec le CPU a 100%

Bonjour
J'ai une VM Ubuntu 18.04 sur ESXI qui me sert de serveur Web avec nginx.
Elle est "au repo" entre 1 et 6% de CPU
En utilisation elle peut monter jusqu'a 35%

Et de temps en temps (entre 1 et 10 jours...) elle a sont CPU qui passe a 100%.

A ce moment la la machine ne répond plus au ssh et il n'est plus possible de se loguer (même via ESXI).
Seul un reset de la VM permet de la récupérer!

Mon probleme est bien sur que la machine est bloqué, mais ma question est : Comment faire pour debuger et déterminer quel process pose pb.

J'ai bien été fouiller dans les logs (syslog, auth.log, nginx/error.log, nginx/access.log, kernel.log)
Mais a part le reboot je ne vois rien, si ce n'est l'heure probable du passage a 100% vu que les requettes snmp que je fait de l’extérieur arrêtent d’être tracé dans les logs bien avant le reboot.

Une idee pour investiguer ?

Merci

Dernière modification par ewok2 (Le 18/12/2018, à 16:01)

Hors ligne

#2 Le 18/12/2018, à 17:37

bruno

Re : Debug d'un Ubuntu qui se bloque avec le CPU a 100%

Bonjour,

Qu'est ce que tu as comme outil de surveillance (monitoring) installé ?
Avec ce type d'outil tu peux voir (ou recevoir une alerte) quand l'utilisation du CPU monte anormalement et lancer une commande de type top sur ton serveur.

Sinon tu peux utiliser atop (paquet du même nom qui permet de surveiller l'activité du système (processus) et qui a l'avantage d'écrire des logs ce qui permet de voir l’activité passée.

#3 Le 18/12/2018, à 22:42

ewok2

Re : Debug d'un Ubuntu qui se bloque avec le CPU a 100%

J'ai un cacti qui fait une requette snmp sur la mib de l'ubuntu.
Et Cacti ne pool que toutes les 5 minutes...
Je vais regarder atop car je pense que ca ne monte pas doucement a 100% et que le monitorring ne sera pas assez reactif.

Merci

Hors ligne