Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 21/05/2008, à 09:15

S'kud

[Nagios] Problème avec un client NRPE

Bonjour à tous,

J'ai un serveur sous Ubuntu 7.10 avec Nagios 2.9 et sur le client NRPE v2.8.1

J'ai installé mon client NRPE sur un 2ème serveur Ubuntu 7.10 (mon Nagios et mon client NRPE sont installés à partir des paquets déjà présent (apt-get) et non des sources)

lorsque je fais un

root@Server:/etc/nagios# /usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_load
OK - Charge moyenne: 0.00, 0.00, 0.00|load1=0.000;15.000;30.000;0; load5=0.000;10.000;25.000;0; load15=0.000;5.000;20.000;0;

Le problème c'est lorsque je rentre ce service dans Nagios, à ce moment là sur l'interface Web, Nagios me dit :

CHECK_NRPE: Error receiving data from daemon.

Voici sur mon client NRPE ce que j'ai modifié
1°) /etc/nagios/nrpe.cfg, j'ai changé

allowed_hosts = @_IP_de_mon_serveur

2°) Sur mon serveur dans /etc/nagios-plugins/config/check_nrpe.cfg

# this command runs a program $ARG1$ without arguments $ARG2$
define command {
        command_name    check_nrpe
        command_line    /usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -n
}

j'ai mis le -n car sinon nagios me dis que la connexion SSL est refusée ... (peut être car je suis connecter via putty sur le serveur et le client depuis un poste windows)

3°) et enfin dans mon /etc/nagios/services.cfg

define service{
        host_name                       clientnrpe
        service_description             CPU load
        is_volatile                     0
        check_period                    8x5
        contact_groups                  admins
        max_check_attempts              4
        normal_check_interval           1
        retry_check_interval            1
        notification_interval           240
        notification_period             8x5
        notification_options            c,r
        check_command                   check_nrpe!check_load
        }

define service{
        host_name                       clientnrpe
        service_description             Users
        is_volatile                     0
        check_period                    8x5
        contact_groups                  admins
        max_check_attempts              4
        normal_check_interval           1
        retry_check_interval            1
        notification_interval           240
        notification_period             8x5
        notification_options            c,r
        check_command                   check_nrpe!check_users!5!10
        }

voilà c'est tout ce que j'ai touché il me semble bien ...

Après quelques heures de prise de tête j'ai tenté ceci : Si je met dans mon fichier /etc/nagios-plugins/config/check_nrpe la commande suivante :

define command {
        command_name    check_nrpe
        command_line    /usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x
}

dans mon interface web de Nagios, tout se passe bien :

NRPE v2.8.1

...
comment se fait il que cette commande passe mais pas les deux autres ??
à des moments l'erreur affichée dans Nagios est "socket timeout after 10 seconds", j'ai donc essayé avec un -t 60, mais rien n'y fait ...

Voilà si quelqu'un à une idée ? Merci d'avance
Cordialement

#2 Le 21/05/2008, à 11:41

lawl

Re : [Nagios] Problème avec un client NRPE

ton host clientnrpe à la bonne ip ?
Sinon tu doit avoir sur clientnrpe un fichier de log (ou du moins il faut l'activer dans le fichier de config) qui peux t'aiguiller.

Ce qui m'étonne c'est qu'a la main tu ne mais pas l'option -n et que cela marche alors que dans nagios tu dois la mettre...

Hors ligne

#3 Le 21/05/2008, à 13:59

S'kud

Re : [Nagios] Problème avec un client NRPE

Oui oui mon client à la bonne ip ... j'ai vérifié, pour mon check_nrpe, si je met $HOSTADDRESS$ ou 192.168.x.x, cela fonctionne et pour les deux autres quelque soit ce que je mette cela ne fonctionne pas ...

et pour le fichier de log qui se trouve dans mon /var/log/nagios/nagios.log, il est blindé ... plus de 86 000 lignes ... qui me disent juste des trucs dans le genre

[1211373589] Warning: Attempting to execute the command "/usr/local/bin/exec_perf "clientnrpe" "PING" "OK" "PING OK -  Paquets perdus = 0%, RTA = 0.64 ms" "" "1211373579"" resulted in a return code of 127.  Make sure the script or binary you are trying to execute actually exists ...
[1211363946] Warning: Attempting to execute the command "/usr/local/bin/exec_perf "clientnrpe" "CPU load" "UNKNOWN" "CHECK_NRPE: Error receiving data from daemon." "" "1211363942"" resulted in a return code of 127.  Make sure the script or binary you are trying to execute actually exists...

à priori le script que j'essaye d'utiliser n'est pas trouvé ... c'est assez bizarre étant donné qu'en ligne de commande ça passe, et que mes chemins sont bons ...
si je vais dans /usr/local/bin/ le répertoire est vide ... aucune trace de exec_perf nulle part ...

quelqu'un aurait il une idée?

Dernière modification par S'kud (Le 21/05/2008, à 14:01)

Hors ligne

#4 Le 21/05/2008, à 14:20

S'kud

Re : [Nagios] Problème avec un client NRPE

Après recherche je me suis aperçu que c'était dans mon misccommands.cfg

##
## here's a sample command to use the perfdata.  this assumes your program
## is called exec_perf
##

define command{
        command_name process-service-perfdata
        command_line /usr/local/bin/exec_perf "$HOSTNAME$" "$SERVICEDESC$" "$SERVICESTATE$" "$OUTPUT$" "$PERFDATA$" "$LASTCHECK$"

Alors ma question est maintenant, qu'est ce qui cloche ? le fait que je n'ai pas de exec_perf dans /usr/local/bin, ou alors me faut il remplacer ce raccourci ? et par quoi ?

Si quelqu'un le sais ... d'avance merci

Hors ligne

#5 Le 21/05/2008, à 14:30

lawl

Re : [Nagios] Problème avec un client NRPE

Je parle des log du client NRPE pas du serveur Nagios.

D'ou sort ce usr/local/bin/exec_perf "clientnrpe" "CPU load ?

Hors ligne

#6 Le 21/05/2008, à 14:45

S'kud

Re : [Nagios] Problème avec un client NRPE

CPU load c'est mon service que j'ai défini dans services.cfg

define service{
        host_name                       clientnrpe
        service_description             CPU load
        is_volatile                     0
        check_period                    8x5
        contact_groups                  admins
        max_check_attempts              4
        normal_check_interval           1
        retry_check_interval            1
        notification_interval           240
        notification_period             8x5
        notification_options            c,r
        check_command                   check_nrpe!check_load
}

pour le fichier de log j'ai regardé dans /var/log/daemon.log

May 19 12:07:14 ClientNRPE init: tty1 main process (3898) killed by TERM signal
May 19 14:30:42 ClientNRPE nrpe[7726]: Starting up daemon
May 19 14:30:42 ClientNRPE nrpe[7726]: Listening for connections on port 5666
May 19 14:30:42 ClientNRPE nrpe[7726]: Allowing connections from: 127.0.0.1
May 19 14:35:50 ClientNRPE nrpe[9977]: Starting up daemon
May 19 14:35:50 ClientNRPE nrpe[9977]: There's already an NRPE server running (PID 7726).  Bailing out...
May 19 14:41:41 ClientNRPE nrpe[9986]: Host @_IP_de_mon_serveur is not allowed to talk to us!

bizarre sachant que dans /etc/nagios/nrpe.cfg, j'ai changé

allowed_hosts = @_IP_de_mon_serveur

Hors ligne

#7 Le 21/05/2008, à 16:22

lawl

Re : [Nagios] Problème avec un client NRPE

tu a relance le service après modif du fichier ?

Hors ligne

#8 Le 21/05/2008, à 16:29

S'kud

Re : [Nagios] Problème avec un client NRPE

ça je l'ai changé dès le départ ... et je relance les services (autant apache2, que nagios, que nagios-nrpe-server) assez souvent ... j'ai tout essayé ...

j'ai suivi presque à la lettre ce tuto ...
http://blog.nicolargo.com/2007/10/surveiller-vos-serveurs-linux-avec-nagios-et-nrpe.html

merci de t'intéresser à mon problème en tout cas lawl

Dernière modification par S'kud (Le 21/05/2008, à 16:37)

Hors ligne

#9 Le 21/05/2008, à 16:40

wblitz

Re : [Nagios] Problème avec un client NRPE

pour le exec_perf, regarde déjà si cette commande est appelée dans la conf nagios :

grep -ri exec_perf /etc/nagios

ensuite regarde si c'est toi qui a défini ou non ce service dans la conf. au besoin, commente le ou supprime le de la config.

comme le fichier /usr/local/bin/exec_perf n'existe pas, tu as des erreurs dans tes logs :

Warning: Attempting to execute the command "/usr/local/bin/exec_perf "clientnrpe" "PING" "OK" "PING OK -  Paquets perdus = 0%, RTA = 0.64 ms" "" "1211373579"" resulted in a return code of 127Make sure the script or binary you are trying to execute actually exists

pour le localiser :

sudo updatedb && locate exec_perf

ensuite tu pourras corriger la définition de la commande process-service-perfdata dans le fichier misscommands.cfg.

il y a également un truc bizarre dans les logs du client :

Allowing connections from: 127.0.0.1

vérifie (comme le disait lawl) que tu as bien la bonne adresse dans la config côté client, arrête le service, tue les processus qui pourraient encore tourner (cf la commande du post de lawl) et relance le service.

ensuite, je te propose d'éliminer les problèmes un par un. d'abord, commente tous les services que tu souhaites vérifier (sur clientnrpe) sauf un (celui pour le load) et remets le fichier /etc/nagios-plugin/config/check_nrpe.cfg dans son état initial :

# this command runs a program $ARG1$ with arguments $ARG2$
define command {
	command_name	check_nrpe
	command_line	/usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$
}

# this command runs a program $ARG1$ with no arguments
define command {
	command_name	check_nrpe_1arg
	command_line	/usr/lib/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}

modifie alors le service pour le load comme suit :

define service{
        host_name                       clientnrpe
        service_description             CPU load
        is_volatile                     0
        check_period                    8x5
        contact_groups                  admins
        max_check_attempts              4
        normal_check_interval           1
        retry_check_interval            1
        notification_interval           240
        notification_period             8x5
        notification_options            c,r
        check_command                   check_nrpe_1arg!check_load
}

ouvre un terminal et tape la commande :

sudo tail -f /var/log/nagios/nagios.log

redémarre nagios (depuis un autre terminal) :

sudo /etc/init.d/nagios reload

et surveille les logs dans le premier terminal en attendant que le service tente de checker le client nrpe. essaie de poster ce qui apparaîtra d'ailleurs, ça pourra nous aider wink

pour l'autre service, ça ne sert pour le moment à rien de s'embêter avec, il faut d'abord faire marcher celui-ci tout seul.

Dernière modification par wblitz (Le 21/05/2008, à 16:44)


"Un optimiste, c'est un homme qui plante deux glands et qui s'achète un hamac" - Jean de Lattre de Tassigny
Pensez à mettre [RÉSOLU] dans le sujet de vos posts une fois qu'ils le sont...
quelques docs

Hors ligne

#10 Le 21/05/2008, à 16:40

lawl

Re : [Nagios] Problème avec un client NRPE

There's already an NRPE server running (PID 7726).  Bailing out

Assure toi bien de ne pas avoir deux service qui tourne.

ps -eadf | grep nrpe

Hors ligne

#11 Le 21/05/2008, à 16:53

S'kud

Re : [Nagios] Problème avec un client NRPE

alors je vais répondre à vos questions une par une ^^

grep -ri exec_perf /etc/nagios

root@UbuntuServer:/etc/nagios# grep -ri exec_perf /etc/nagios
/etc/nagios/misccommands.cfg:## is called exec_perf
/etc/nagios/misccommands.cfg:#  command_line /usr/local/bin/exec_perf "$HOSTNAME$" "$SERVICEDESC$" "$SERVICESTATE$" "$OUTPUT$" "$PERFDATA$" "$LASTCHECK$"

ensuite,

sudo updatedb && locate exec_perf

Ne renvoi rien hmm

Allowing connections from: 127.0.0.1

En fait je me suis aperçu que dans ce fichier /etc/nagios/nrpe.conf il y avait ceci

# SERVER ADDRESS
# Address that nrpe should bind to in case there are more than one interface
# and you do not want nrpe to bind on all interfaces.
# NOTE: This option is ignored if NRPE is running under either inetd or xinetd

#server_address=127.0.0.1

et je me suis dis peut être faut il décommenter cette otpion (pour tester), et en testant ça m'a donné ça et il m'était impossible d'afficher ma version du daemon NRPE, je l'ai donc recommenté ...

Je vais tester ce que tu m'as conseillé ensuite, et ce que m'as conseillé lawl juste après toi.
J'vous tiendrais au courant wink merci beaucoup

Dernière modification par S'kud (Le 21/05/2008, à 16:54)

Hors ligne

#12 Le 21/05/2008, à 17:01

wblitz

Re : [Nagios] Problème avec un client NRPE

pour le exec_perf, comme le fichier n'est pas présent sur ton système, tu peux commenter la définition de la commande dans misscommands.cfg et il te faudra également commenter toutes les définitions de service faisant appel à la commande (au sens nagios) process-service-perfdata (tu peux utiliser la commande "grep process-service-perfdata" pour lister les fichiers concernés)


"Un optimiste, c'est un homme qui plante deux glands et qui s'achète un hamac" - Jean de Lattre de Tassigny
Pensez à mettre [RÉSOLU] dans le sujet de vos posts une fois qu'ils le sont...
quelques docs

Hors ligne

#13 Le 22/05/2008, à 14:45

S'kud

Re : [Nagios] Problème avec un client NRPE

Je vais vous avouer que là je n'y comprend pas grand chose ... ce matin je suis arrivé, je n'ai pas regardé si Nagios fonctionnait, je me suis attaché à la notification par SMS, mon serveur ne détectant pas les ports USB, je me suis dis "il n'y a pas ce qu'il faut t'es bon pour une recompilation du noyau coco" donc autant vous dire que vérifier si mon Nagios fonctionnait était le dernier de mes soucis, puis à tout hasard j'ai vérifié et mes ports USB n'étaient pas actifs dans le BIOS ... OUF !! et en plus mes envois de SMS fonctionnent ^^

et me revoilà partit pour mes problèmes de NRPE ... pour m'apercevoir que Nagios ne marche plus ... (il tourne mais l'interface web me retourne ceci)

Whoops!

Error: Could not read host and service status information!

c'est à n'y rien comprendre ... hier soir en partant, après avoir fait ce que vous m'aviez dit (qui ne remet pas en cause le fonctionnement de Nagios) tout était niquel et là d'un coup plus rien ... hum ... donc j'vais chercher un coup et j'vous dis dès que c'est bon ...

et si je restart nagios, il me dit

root@UbuntuServer:/usr/share/nagios/htdocs# /etc/init.d/nagios restart
* Restarting nagios monitoring daemon nagios                                   kill: 253: No such process

Dernière modification par S'kud (Le 22/05/2008, à 15:17)

Hors ligne

#14 Le 22/05/2008, à 15:58

lawl

Re : [Nagios] Problème avec un client NRPE

résultat de ps -eadf  ?

Hors ligne

#15 Le 23/05/2008, à 08:26

S'kud

Re : [Nagios] Problème avec un client NRPE

C'est bon j'ai résolu mon problème, je peux revenir sur le précédent ^^

root@UbuntuServer:/etc/nagios# ps -eadf |grep nagios
nagios   10296     1  0 09:16 ?        00:00:00 /usr/sbin/nagios -d /etc/nagios/nagios.cfg
root     10345 10116  0 09:21 pts/0    00:00:00 grep nagios

lorsque je fait un /etc/init.d/nagios reload il ne se passe rien dans nagios.log, si je fait un restart voici ce qu'il m'affiche (la deux premières lignes sont déjà présente, les 2 suivantes se rajoutent ...)

root@UbuntuServer:/etc/nagios# sudo tail -f /var/log/nagios/nagios.log
[1211526990] Nagios 1.4 starting... (PID=10295)
[1211526990] Finished daemonizing... (New PID=10296)
[1211527455] Nagios 1.4 starting... (PID=10496)
[1211527455] Finished daemonizing... (New PID=10497)

une idée ? merci en tout cas

Hors ligne

#16 Le 23/05/2008, à 09:02

lawl

Re : [Nagios] Problème avec un client NRPE

Reprennons a zero tu essaye de regler quoi la ?

Hors ligne

#17 Le 23/05/2008, à 09:12

S'kud

Re : [Nagios] Problème avec un client NRPE

oki désolé j'vous ai embrouillé un peu avec mon problème de page web ^^

en fait sur mon interface web ou même en ligne de commande, nagios m'affiche

CHECK_NRPE: Error receiving data from daemon

pour les check_load et check_users, tandis que pour un check_nrpe normal , il me retourne bien la version de mon client NRPE à savoir

NRPE v2.8.1

Hors ligne

#18 Le 23/05/2008, à 10:27

S'kud

Re : [Nagios] Problème avec un client NRPE

Bon j'ai cherché toute la matinée ... et bonne nouvelle j'ai réussi ...
hier soir j'ai réinstallé Nagios et Apache2, ce matin j'ai fait quelques tests, ça ne marchait toujours pas ...
puis en regardant dans /var/log/daemon.log (sur mon client) j'ai vu les lignes

May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_users]=/usr/lib/nagios/plugins/check_users -w 5 -c 10
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_load]=/usr/lib/nagios/plugins/check_load -w 15,10,5 -c 30,25,20
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_hda1]=/usr/lib/nagios/plugins/check_disk -w 20 -c 10 -p /dev/hda1
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_zombie_procs]=/usr/lib/nagios/plugins/check_procs -w 5 -c 10 -s Z
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_total_procs]=/usr/lib/nagios/plugins/check_procs -w 150 -c 200
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_users]=/usr/lib/nagios/plugins/check_users -w $ARG1$ -c $ARG2$
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_load]=/usr/lib/nagios/plugins/check_load -w $ARG1$ -c $ARG2$
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_disk]=/usr/lib/nagios/plugins/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
May 23 08:46:30 ClientNRPE nrpe[3918]: Added command[check_procs]=/usr/lib/nagios/plugins/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$

et lorsque je rentrais une commande du style

 /usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_users

Nagios me retournais la syntaxe à utiliser:

/usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_users -w 5 -c 10

(qui n'est pas la bonne)
et je me suis aperçu en lisant, qu'en fait la syntaxe correcte à utiliser était :

/usr/lib/nagios/plugins/check_nrpe -H 192.168.x.x -c check_users -a 5 10

J'ai donc changé cela dans mon /etc/nagios/services.cfg, tout reloadé ... et ça fonctionne ...

Dernière modification par S'kud (Le 27/05/2008, à 10:32)

Hors ligne

#19 Le 29/09/2011, à 11:52

tsiryfetra

Re : [Nagios] Problème avec un client NRPE

bonjour,:)

Je sais que ma réponse va être trop tard mais une chose est sur, elle sera toujousr utilse pour les nouveaux aventuriers...

Je poste ici la solution à l'erreur CHECK_NRPE : Error receiving data from daemon.

Installer et configurer nagios et nrpe, nrpe-plugin, nrpe-server (des tutos sont disponible sur le net)

=> Il faut juste ajouter le droit à l'utilisateur nagios en éditant le fichiers des sudoers

# visudo
ajouter la ligne suivante (suivant le chemin d'installation des plugins)
nagios ALL=(ALL) NOPASSWD :/usr/lib/nagios/plugins/

enregistrer le fichier, redemarrer le service nagios et voilà, le tour est joué.

Cette manip est à faire sur le poste client ainsi que sur le serveur de monitoring, à noter que sur le poste client

TsiryFetra/Madagascar

Hors ligne