Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 24/07/2006, à 16:14

ostaquet

[résolu] Munin comportement étrange du plugin CPU

Salut à tous,

j'ai constaté un comportement assez étonnant du plugin CPU de Munin sur un de nos serveurs. Il s'agit d'un noeud d'un cluster (deux noeuds parfaitement identique dans le cluster; machines, OS et installation identiques).

Sur le noeud en question, c'est un biprocesseur (donc, l'usage CPU peut grimper jusque 200%). Le problème est qu'il ne dépasse jamais 140%...

Je soupsonne également Munin de me fournir des graphes éronnés en terme de partage du temps CPU entre les différents états (idle, iowait, system, user,...).

Regardez le fichier image ci-joint (car le pire, c'est que ça n'a pas été toujours comme ça). Je précise qu'aucun changement de config n'a été effectué au moment des changements sur le graphe.

3655_nodeprod1cpu_month.jpg

Si quelqu'un a une idée, elle est la bienvenue ?

A bientôt,

Olivier STAQUET

Dernière modification par ostaquet (Le 02/08/2006, à 10:34)

Hors ligne

#2 Le 02/08/2006, à 10:34

ostaquet

Re : [résolu] Munin comportement étrange du plugin CPU

Bonjour à tous,

j'ai finalement résolu mon problème tout seul. Ce n'était pas un bogue ou un problème de configuration de Munin ! C'était un problème au niveau du serveur.

Le taux de softirq est très élevé. J'ai constaté également que lors de ces "plats" à 142%, le taux de fork montait très haut. Lors des plats, le taux de fork est de 4~5 / secondes en continu alors qu'en production normale, on ne dépasse pas 2/s durant les heures de bureau et 1/s pendant la nuit. Le taux d'interruption montent également en flèche sur l'interface eth2 (celles qui est connecté côté LAN) (eth0 est côté prod et eth1 est pour le DRBD du cluster).

Par simplicité (et par urgence car les utilisateurs commençait à se plaindre), j'ai redémarré le serveur.

Après cela, tout est ok (mais pour combien de temps ?... :-( ) D'après ce que j'ai pu déterminé, ce serait une machine du LAN qui pose problème. Sous XP Pro, dans le taskmanager lors d'un transfert d'un fichier de 250Mo via Samba, le réseau fait des "dents de scies" aux alentours de 40% quand on accède à partir de cette machine alors que les autres machines font des beaux plats montant à 80% d'usage du réseau.

Je soupçonne cette machine de provoquer un état incorrect (mais je ne sais pas comment) aux niveaux du serveur. La prochaine étape est d'attendre un nouvel incident, tuer les processus liées au suspect et voir ce qui se passe.

Je ne continuerai pas dans ce post vu que cela sort du cadre de la question.

A bientôt,

Olivier STAQUET

Hors ligne

#3 Le 15/11/2006, à 17:18

ostaquet

Re : [résolu] Munin comportement étrange du plugin CPU

Bonjour à tous,

pour compléter ce thread (pour les archives), j'ai enfin découvert d'où venait le problème.

La machine qui était soupçonnée a été remplacée mais le problème est ré-apparu par la suite.

Pour résoudre le problème, je dois arrêter et re-démarrer la carte réseau eth2 !!!
D'après les graphes Munin, lorsque le problème de charge CPU survient, le taux d'interruptions générés par la carte eth2 monte en flèche et se stabilise à 1000 interruptions/sec...

Je soupçonne donc un problème hardware au niveau de cette carte. Pour le moment, on résoud le problème en faisant un :

sudo ifdown eth2
sudo ifup eth2

et suite à ça, le taux d'interruption revient à la normale.

A bientôt,

Olivier STAQUET

Hors ligne

#4 Le 15/11/2006, à 20:41

Uggy

Re : [résolu] Munin comportement étrange du plugin CPU

Merci Olivier pour ces infos.. (et pour tes contributions en général wink )

Hors ligne