Pages : 1
#1 Le 21/05/2008, à 09:15
- S'kud
[Nagios] Problème avec un client NRPE
Bonjour à tous,
J'ai un serveur sous Ubuntu 7.10 avec Nagios 2.9 et sur le client NRPE v2.8.1
J'ai installé mon client NRPE sur un 2ème serveur Ubuntu 7.10 (mon Nagios et mon client NRPE sont installés à partir des paquets déjà présent (apt-get) et non des sources)
lorsque je fais un
root@Server:/etc/nagios# /usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_load
OK - Charge moyenne: 0.00, 0.00, 0.00|load1=0.000;15.000;30.000;0; load5=0.000;10.000;25.000;0; load15=0.000;5.000;20.000;0;
Le problème c'est lorsque je rentre ce service dans Nagios, à ce moment là sur l'interface Web, Nagios me dit :
CHECK_NRPE: Error receiving data from daemon.
Voici sur mon client NRPE ce que j'ai modifié
1°) /etc/nagios/nrpe.cfg, j'ai changé
allowed_hosts = @_IP_de_mon_serveur
2°) Sur mon serveur dans /etc/nagios-plugins/config/check_nrpe.cfg
# this command runs a program $ARG1$ without arguments $ARG2$
define command {
command_name check_nrpe
command_line /usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -n
}
j'ai mis le -n car sinon nagios me dis que la connexion SSL est refusée ... (peut être car je suis connecter via putty sur le serveur et le client depuis un poste windows)
3°) et enfin dans mon /etc/nagios/services.cfg
define service{
host_name clientnrpe
service_description CPU load
is_volatile 0
check_period 8x5
contact_groups admins
max_check_attempts 4
normal_check_interval 1
retry_check_interval 1
notification_interval 240
notification_period 8x5
notification_options c,r
check_command check_nrpe!check_load
}
define service{
host_name clientnrpe
service_description Users
is_volatile 0
check_period 8x5
contact_groups admins
max_check_attempts 4
normal_check_interval 1
retry_check_interval 1
notification_interval 240
notification_period 8x5
notification_options c,r
check_command check_nrpe!check_users!5!10
}
voilà c'est tout ce que j'ai touché il me semble bien ...
Après quelques heures de prise de tête j'ai tenté ceci : Si je met dans mon fichier /etc/nagios-plugins/config/check_nrpe la commande suivante :
define command {
command_name check_nrpe
command_line /usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x
}
dans mon interface web de Nagios, tout se passe bien :
NRPE v2.8.1
...
comment se fait il que cette commande passe mais pas les deux autres ??
à des moments l'erreur affichée dans Nagios est "socket timeout after 10 seconds", j'ai donc essayé avec un -t 60, mais rien n'y fait ...
Voilà si quelqu'un à une idée ? Merci d'avance
Cordialement
#2 Le 21/05/2008, à 11:41
- lawl
Re : [Nagios] Problème avec un client NRPE
ton host clientnrpe à la bonne ip ?
Sinon tu doit avoir sur clientnrpe un fichier de log (ou du moins il faut l'activer dans le fichier de config) qui peux t'aiguiller.
Ce qui m'étonne c'est qu'a la main tu ne mais pas l'option -n et que cela marche alors que dans nagios tu dois la mettre...
Hors ligne
#3 Le 21/05/2008, à 13:59
- S'kud
Re : [Nagios] Problème avec un client NRPE
Oui oui mon client à la bonne ip ... j'ai vérifié, pour mon check_nrpe, si je met $HOSTADDRESS$ ou 192.168.x.x, cela fonctionne et pour les deux autres quelque soit ce que je mette cela ne fonctionne pas ...
et pour le fichier de log qui se trouve dans mon /var/log/nagios/nagios.log, il est blindé ... plus de 86 000 lignes ... qui me disent juste des trucs dans le genre
[1211373589] Warning: Attempting to execute the command "/usr/local/bin/exec_perf "clientnrpe" "PING" "OK" "PING OK - Paquets perdus = 0%, RTA = 0.64 ms" "" "1211373579"" resulted in a return code of 127. Make sure the script or binary you are trying to execute actually exists ...
[1211363946] Warning: Attempting to execute the command "/usr/local/bin/exec_perf "clientnrpe" "CPU load" "UNKNOWN" "CHECK_NRPE: Error receiving data from daemon." "" "1211363942"" resulted in a return code of 127. Make sure the script or binary you are trying to execute actually exists...
à priori le script que j'essaye d'utiliser n'est pas trouvé ... c'est assez bizarre étant donné qu'en ligne de commande ça passe, et que mes chemins sont bons ...
si je vais dans /usr/local/bin/ le répertoire est vide ... aucune trace de exec_perf nulle part ...
quelqu'un aurait il une idée?
Dernière modification par S'kud (Le 21/05/2008, à 14:01)
Hors ligne
#4 Le 21/05/2008, à 14:20
- S'kud
Re : [Nagios] Problème avec un client NRPE
Après recherche je me suis aperçu que c'était dans mon misccommands.cfg
##
## here's a sample command to use the perfdata. this assumes your program
## is called exec_perf
##
define command{
command_name process-service-perfdata
command_line /usr/local/bin/exec_perf "$HOSTNAME$" "$SERVICEDESC$" "$SERVICESTATE$" "$OUTPUT$" "$PERFDATA$" "$LASTCHECK$"
Alors ma question est maintenant, qu'est ce qui cloche ? le fait que je n'ai pas de exec_perf dans /usr/local/bin, ou alors me faut il remplacer ce raccourci ? et par quoi ?
Si quelqu'un le sais ... d'avance merci
Hors ligne
#5 Le 21/05/2008, à 14:30
- lawl
Re : [Nagios] Problème avec un client NRPE
Je parle des log du client NRPE pas du serveur Nagios.
D'ou sort ce usr/local/bin/exec_perf "clientnrpe" "CPU load ?
Hors ligne
#6 Le 21/05/2008, à 14:45
- S'kud
Re : [Nagios] Problème avec un client NRPE
CPU load c'est mon service que j'ai défini dans services.cfg
define service{
host_name clientnrpe
service_description CPU load
is_volatile 0
check_period 8x5
contact_groups admins
max_check_attempts 4
normal_check_interval 1
retry_check_interval 1
notification_interval 240
notification_period 8x5
notification_options c,r
check_command check_nrpe!check_load
}
pour le fichier de log j'ai regardé dans /var/log/daemon.log
May 19 12:07:14 ClientNRPE init: tty1 main process (3898) killed by TERM signal
May 19 14:30:42 ClientNRPE nrpe[7726]: Starting up daemon
May 19 14:30:42 ClientNRPE nrpe[7726]: Listening for connections on port 5666
May 19 14:30:42 ClientNRPE nrpe[7726]: Allowing connections from: 127.0.0.1
May 19 14:35:50 ClientNRPE nrpe[9977]: Starting up daemon
May 19 14:35:50 ClientNRPE nrpe[9977]: There's already an NRPE server running (PID 7726). Bailing out...
May 19 14:41:41 ClientNRPE nrpe[9986]: Host @_IP_de_mon_serveur is not allowed to talk to us!
bizarre sachant que dans /etc/nagios/nrpe.cfg, j'ai changé
allowed_hosts = @_IP_de_mon_serveur
Hors ligne
#7 Le 21/05/2008, à 16:22
- lawl
Re : [Nagios] Problème avec un client NRPE
tu a relance le service après modif du fichier ?
Hors ligne
#8 Le 21/05/2008, à 16:29
- S'kud
Re : [Nagios] Problème avec un client NRPE
ça je l'ai changé dès le départ ... et je relance les services (autant apache2, que nagios, que nagios-nrpe-server) assez souvent ... j'ai tout essayé ...
j'ai suivi presque à la lettre ce tuto ...
http://blog.nicolargo.com/2007/10/surveiller-vos-serveurs-linux-avec-nagios-et-nrpe.html
merci de t'intéresser à mon problème en tout cas lawl
Dernière modification par S'kud (Le 21/05/2008, à 16:37)
Hors ligne
#9 Le 21/05/2008, à 16:40
- wblitz
Re : [Nagios] Problème avec un client NRPE
pour le exec_perf, regarde déjà si cette commande est appelée dans la conf nagios :
grep -ri exec_perf /etc/nagios
ensuite regarde si c'est toi qui a défini ou non ce service dans la conf. au besoin, commente le ou supprime le de la config.
comme le fichier /usr/local/bin/exec_perf n'existe pas, tu as des erreurs dans tes logs :
Warning: Attempting to execute the command "/usr/local/bin/exec_perf "clientnrpe" "PING" "OK" "PING OK - Paquets perdus = 0%, RTA = 0.64 ms" "" "1211373579"" resulted in a return code of 127. Make sure the script or binary you are trying to execute actually exists
pour le localiser :
sudo updatedb && locate exec_perf
ensuite tu pourras corriger la définition de la commande process-service-perfdata dans le fichier misscommands.cfg.
il y a également un truc bizarre dans les logs du client :
Allowing connections from: 127.0.0.1
vérifie (comme le disait lawl) que tu as bien la bonne adresse dans la config côté client, arrête le service, tue les processus qui pourraient encore tourner (cf la commande du post de lawl) et relance le service.
ensuite, je te propose d'éliminer les problèmes un par un. d'abord, commente tous les services que tu souhaites vérifier (sur clientnrpe) sauf un (celui pour le load) et remets le fichier /etc/nagios-plugin/config/check_nrpe.cfg dans son état initial :
# this command runs a program $ARG1$ with arguments $ARG2$
define command {
command_name check_nrpe
command_line /usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$
}
# this command runs a program $ARG1$ with no arguments
define command {
command_name check_nrpe_1arg
command_line /usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
modifie alors le service pour le load comme suit :
define service{
host_name clientnrpe
service_description CPU load
is_volatile 0
check_period 8x5
contact_groups admins
max_check_attempts 4
normal_check_interval 1
retry_check_interval 1
notification_interval 240
notification_period 8x5
notification_options c,r
check_command check_nrpe_1arg!check_load
}
ouvre un terminal et tape la commande :
sudo tail -f /var/log/nagios/nagios.log
redémarre nagios (depuis un autre terminal) :
sudo /etc/init.d/nagios reload
et surveille les logs dans le premier terminal en attendant que le service tente de checker le client nrpe. essaie de poster ce qui apparaîtra d'ailleurs, ça pourra nous aider
pour l'autre service, ça ne sert pour le moment à rien de s'embêter avec, il faut d'abord faire marcher celui-ci tout seul.
Dernière modification par wblitz (Le 21/05/2008, à 16:44)
"Un optimiste, c'est un homme qui plante deux glands et qui s'achète un hamac" - Jean de Lattre de Tassigny
Pensez à mettre [RÉSOLU] dans le sujet de vos posts une fois qu'ils le sont...
quelques docs
Hors ligne
#10 Le 21/05/2008, à 16:40
- lawl
Re : [Nagios] Problème avec un client NRPE
There's already an NRPE server running (PID 7726). Bailing out
Assure toi bien de ne pas avoir deux service qui tourne.
ps -eadf | grep nrpe
Hors ligne
#11 Le 21/05/2008, à 16:53
- S'kud
Re : [Nagios] Problème avec un client NRPE
alors je vais répondre à vos questions une par une ^^
grep -ri exec_perf /etc/nagios
root@UbuntuServer:/etc/nagios# grep -ri exec_perf /etc/nagios
/etc/nagios/misccommands.cfg:## is called exec_perf
/etc/nagios/misccommands.cfg:# command_line /usr/local/bin/exec_perf "$HOSTNAME$" "$SERVICEDESC$" "$SERVICESTATE$" "$OUTPUT$" "$PERFDATA$" "$LASTCHECK$"
ensuite,
sudo updatedb && locate exec_perf
Ne renvoi rien
Allowing connections from: 127.0.0.1
En fait je me suis aperçu que dans ce fichier /etc/nagios/nrpe.conf il y avait ceci
# SERVER ADDRESS
# Address that nrpe should bind to in case there are more than one interface
# and you do not want nrpe to bind on all interfaces.
# NOTE: This option is ignored if NRPE is running under either inetd or xinetd
#server_address=127.0.0.1
et je me suis dis peut être faut il décommenter cette otpion (pour tester), et en testant ça m'a donné ça et il m'était impossible d'afficher ma version du daemon NRPE, je l'ai donc recommenté ...
Je vais tester ce que tu m'as conseillé ensuite, et ce que m'as conseillé lawl juste après toi.
J'vous tiendrais au courant merci beaucoup
Dernière modification par S'kud (Le 21/05/2008, à 16:54)
Hors ligne
#12 Le 21/05/2008, à 17:01
- wblitz
Re : [Nagios] Problème avec un client NRPE
pour le exec_perf, comme le fichier n'est pas présent sur ton système, tu peux commenter la définition de la commande dans misscommands.cfg et il te faudra également commenter toutes les définitions de service faisant appel à la commande (au sens nagios) process-service-perfdata (tu peux utiliser la commande "grep process-service-perfdata" pour lister les fichiers concernés)
"Un optimiste, c'est un homme qui plante deux glands et qui s'achète un hamac" - Jean de Lattre de Tassigny
Pensez à mettre [RÉSOLU] dans le sujet de vos posts une fois qu'ils le sont...
quelques docs
Hors ligne
#13 Le 22/05/2008, à 14:45
- S'kud
Re : [Nagios] Problème avec un client NRPE
Je vais vous avouer que là je n'y comprend pas grand chose ... ce matin je suis arrivé, je n'ai pas regardé si Nagios fonctionnait, je me suis attaché à la notification par SMS, mon serveur ne détectant pas les ports USB, je me suis dis "il n'y a pas ce qu'il faut t'es bon pour une recompilation du noyau coco" donc autant vous dire que vérifier si mon Nagios fonctionnait était le dernier de mes soucis, puis à tout hasard j'ai vérifié et mes ports USB n'étaient pas actifs dans le BIOS ... OUF !! et en plus mes envois de SMS fonctionnent ^^
et me revoilà partit pour mes problèmes de NRPE ... pour m'apercevoir que Nagios ne marche plus ... (il tourne mais l'interface web me retourne ceci)
Whoops!
Error: Could not read host and service status information!
c'est à n'y rien comprendre ... hier soir en partant, après avoir fait ce que vous m'aviez dit (qui ne remet pas en cause le fonctionnement de Nagios) tout était niquel et là d'un coup plus rien ... hum ... donc j'vais chercher un coup et j'vous dis dès que c'est bon ...
et si je restart nagios, il me dit
root@UbuntuServer:/usr/share/nagios/htdocs# /etc/init.d/nagios restart
* Restarting nagios monitoring daemon nagios kill: 253: No such process
Dernière modification par S'kud (Le 22/05/2008, à 15:17)
Hors ligne
#14 Le 22/05/2008, à 15:58
- lawl
Re : [Nagios] Problème avec un client NRPE
résultat de ps -eadf ?
Hors ligne
#15 Le 23/05/2008, à 08:26
- S'kud
Re : [Nagios] Problème avec un client NRPE
C'est bon j'ai résolu mon problème, je peux revenir sur le précédent ^^
root@UbuntuServer:/etc/nagios# ps -eadf |grep nagios
nagios 10296 1 0 09:16 ? 00:00:00 /usr/sbin/nagios -d /etc/nagios/nagios.cfg
root 10345 10116 0 09:21 pts/0 00:00:00 grep nagios
lorsque je fait un /etc/init.d/nagios reload il ne se passe rien dans nagios.log, si je fait un restart voici ce qu'il m'affiche (la deux premières lignes sont déjà présente, les 2 suivantes se rajoutent ...)
root@UbuntuServer:/etc/nagios# sudo tail -f /var/log/nagios/nagios.log
[1211526990] Nagios 1.4 starting... (PID=10295)
[1211526990] Finished daemonizing... (New PID=10296)
[1211527455] Nagios 1.4 starting... (PID=10496)
[1211527455] Finished daemonizing... (New PID=10497)
une idée ? merci en tout cas
Hors ligne
#16 Le 23/05/2008, à 09:02
- lawl
Re : [Nagios] Problème avec un client NRPE
Reprennons a zero tu essaye de regler quoi la ?
Hors ligne
#17 Le 23/05/2008, à 09:12
- S'kud
Re : [Nagios] Problème avec un client NRPE
oki désolé j'vous ai embrouillé un peu avec mon problème de page web ^^
en fait sur mon interface web ou même en ligne de commande, nagios m'affiche
CHECK_NRPE: Error receiving data from daemon
pour les check_load et check_users, tandis que pour un check_nrpe normal , il me retourne bien la version de mon client NRPE à savoir
NRPE v2.8.1
Hors ligne
#18 Le 23/05/2008, à 10:27
- S'kud
Re : [Nagios] Problème avec un client NRPE
Bon j'ai cherché toute la matinée ... et bonne nouvelle j'ai réussi ...
hier soir j'ai réinstallé Nagios et Apache2, ce matin j'ai fait quelques tests, ça ne marchait toujours pas ...
puis en regardant dans /var/log/daemon.log (sur mon client) j'ai vu les lignes
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_users]=/usr/lib/nagios/plugins/check_users -w 5 -c 10
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_load]=/usr/lib/nagios/plugins/check_load -w 15,10,5 -c 30,25,20
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_hda1]=/usr/lib/nagios/plugins/check_disk -w 20 -c 10 -p /dev/hda1
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_zombie_procs]=/usr/lib/nagios/plugins/check_procs -w 5 -c 10 -s Z
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_total_procs]=/usr/lib/nagios/plugins/check_procs -w 150 -c 200
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_users]=/usr/lib/nagios/plugins/check_users -w $ARG1$ -c $ARG2$
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_load]=/usr/lib/nagios/plugins/check_load -w $ARG1$ -c $ARG2$
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_disk]=/usr/lib/nagios/plugins/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_procs]=/usr/lib/nagios/plugins/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$
et lorsque je rentrais une commande du style
/usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_users
Nagios me retournais la syntaxe à utiliser:
/usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_users -w 5 -c 10
(qui n'est pas la bonne)
et je me suis aperçu en lisant, qu'en fait la syntaxe correcte à utiliser était :
/usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_users -a 5 10
J'ai donc changé cela dans mon /etc/nagios/services.cfg, tout reloadé ... et ça fonctionne ...
Dernière modification par S'kud (Le 27/05/2008, à 10:32)
Hors ligne
#19 Le 29/09/2011, à 11:52
- tsiryfetra
Re : [Nagios] Problème avec un client NRPE
bonjour,:)
Je sais que ma réponse va être trop tard mais une chose est sur, elle sera toujousr utilse pour les nouveaux aventuriers...
Je poste ici la solution à l'erreur CHECK_NRPE : Error receiving data from daemon.
Installer et configurer nagios et nrpe, nrpe-plugin, nrpe-server (des tutos sont disponible sur le net)
=> Il faut juste ajouter le droit à l'utilisateur nagios en éditant le fichiers des sudoers
# visudo
ajouter la ligne suivante (suivant le chemin d'installation des plugins)
nagios ALL=(ALL) NOPASSWD :/usr/lib/nagios/plugins/
enregistrer le fichier, redemarrer le service nagios et voilà, le tour est joué.
Cette manip est à faire sur le poste client ainsi que sur le serveur de monitoring, à noter que sur le poste client
TsiryFetra/Madagascar
Hors ligne
Pages : 1