Tag: fullyautomatednagios

[TIPS] PDH error avec NSClient++

Un grand nombre de personnes utilise l’agent NSClient++ pour surveiller les serveurs Win****.

Parfois vous installez et ça fonctionne sans problème mais vous pouvez avoir des erreurs. L’erreur que je rencontre souvent est celle qui concerne les « Performance Data Helper ».

Pour les curieux, voici un lien avec les codes d’erreurs et leur description:

http://msdn.microsoft.com/en-us/library/windows/desktop/aa373046%28v=vs.85%29.aspx

Prenons un exemple d’erreurs que vous pourriez avoir dans le message de sortie du plugin que vous utilisez:

  • CPU

NSClient – ERROR: Could not get data for 5 perhaps we don’t collect data this far back?

  • Mémoire

NSClient – ERROR: Failed to get PDH value.

  • Uptime

NSClient – ERROR: Could not get value

Dans le fichier de log NSC.log (disponible uniquement si les logs sont activés):

2008-07-03 14:13:35: error:.\PDHCollector.cpp:286: Failed to get UPTIME value: No value has been collected yet
2008-07-03 14:13:36: error:.\PDHCollector.cpp:264: Failed to get CPU value: No value has been collected yet
2008-07-03 14:13:37: error:.\PDHCollector.cpp:327: Failed to get MEM_CMT value: No value has been collected yet

Pas de panique, il y a une solution pour corriger ce problème.

Pour résoudre ce problème, il faut réaliser les action suivantes sur le serveur supervisé:

  1. Éteindre le service NSClient++
  2. Lancer la commande LODCTR /R en ligne de commande
  3. Relancer le service NSClient

Une fois ces actions effectuées, votre problème devrait être résolu.

J’espère que ce billet vous aidera si un jour vous rencontrez cette erreur.


Premier livre sur Centreon

Le premier livre sur Centreon « centreon maitrisez la supervision de votre système d’information » a été publié le 06 octobre 2012. L’ouvrage aux éditions ENI est écrit par Loic FONTAINE et Bruno LEGROS avec une préface de Cédric TEMPLE (aka le sérial préfaceur :-) ).

Que vous êtes débutant, utilisateur de Centreon, administrateur système, DSI, etc et que vous désirez apprendre ou approfondir vos connaissances sur Centreon, ce livre est fait pour vous.

L’auteur familiarise le lecteur peut à peut avec l’interface de Centreon, ce qui lui permet de monter rapidement en compétence sur le sujet.

Plusieurs ordonnanceurs et brokers sont abordés comme Nagios, Centreon-Engine et NDO utils et Centreon-Broker.

Un livre complet qui donne même des astuces pour développer ses propres sondes (plugins ou greffons) ainsi qu’une section troubleshoot.

Vous pouvez acheter ce livre sur le site des éditions ENI.

Bonne lecture si vous achetez cet ouvrage.


Comment installer VMware tools sur CES, FAN ou encore CentOS partie 1

Aujourd’hui il n’est pas rare de voir un serveur de supervision virtualisé. Et souvent dans le monde de l’entreprise, c’est la solution de VMware qui est utilisé. Qui dit virtualisation dit aussi outils à installer sur le serveur virtualisé pour optimiser le système d’exploitation de la VM.

Chez VMware c’est l’outil VMware tools qu’il faut « impérativement » installé sur les VMs. Oui impérativement car il peut arriver que le système d’exploitation de la VM devienne instable du fait que cette outil est manquant. Parfois on perd quelques heures avant de se dire « si j’installais les VMware tools », et hop on redémarre la VM et tout est en ordre.

Dans ce billet, nous verrons une des différentes méthodes pour installer les VMware sur les systèmes basés sur RedHat (CentOS, CES, FAN, etc). Cette méthode n’est certainement pas la meilleure mais peut vous dépanner.

La première étape consiste à rajouter les clé GPG de VMware sur votre VM par l’intermédiaire des commandes suivantes:


rpm --import http://packages.vmware.com/tools/keys/VMWARE-PACKAGING-GPG-DSA-KEY.pub
rpm --import http://packages.vmware.com/tools/keys/VMWARE-PACKAGING-GPG-RSA-KEY.pub

Nous rajoutons ces clé GPG car l’installation de VMware tools sera fait via les dépôts de VMware.

La deuxième étape consiste à créer le fichier vmware-tools.repo dans le répertoire /etc/yum.repo.d/ et d’y ajouter les lignes suivantes:


[vmware-tools]
name=VMware Tools
baseurl=http://packages.vmware.com/tools/esx/4.1/rhel6/$basearch
enabled=1
gpgcheck=1


Remarque: Dans cette exemple, nous allons installer VMware tools pour VMware ESX 4.1 sur une RedHat 6. Vous devrez adapter ce fichier en fonction des versions d’ESX et de RedHat que vous utilisez !

Maintenant que le dépôt a été rajouté, nous allons installer VMware Tools:


yum install vmware-open-vm-tools-nox

vCenter affichera le status “Unmanaged” pour votre VM, cela signifie que ce n’est pas lui qui va gérer les mise à jour mais plutôt votre gestionnaire de paquet.

Dans un prochain article nous verrons une deuxième méthode pour installer VMware Tools.


Améliorer l’affichage des graphiques dans Centreon

Pour ce qui ne le savais pas il est possible de personnaliser l’affichage des graphiques dans Centreon. Effectivement il est possible de choisir la couleur du fond, la couleur des lignes ou des aires des graphiques, etc. Je ne vais pas cité toutes les fonctionnalités car le but de cet article n’est pas de toutes les cités mais d’attirer votre attention sur les plus importantes.

Une des personnalisation possible qui me plaît particulièrement à cœur, c’est l’empilage des graphiques ou courbes (stack). Cette fonctionnalité est pratique pour afficher les graphiques du Load Average ou encore les statistiques CPU comme par exemple le cpu_idle, spu_system, …

Dans cette article, nous allons vous montrer comment configurer l’empilage des graphiques ou courbes sur l’indicateur « Load Average ». Pour ce faire, connectez-vous à Centreon avec un compte administrateur de préférence. Cliquez sur l’onglet « Views » puis sur « Graphs » et enfin sur « Curves« . Il faudra cliquer sur la métrique load_1 pour la modifier et y ajouter les informations comme dans la capture d’écran ci-dessous:

Vous remarquerez que nous avons coché les case « Stack » (empilage) et « Filling » (remplissage), puis ajouter un numéro 1 pour « order » qui correspond à l’ordre d’affichage des métriques. Une fois la métrique load_1 configuré il vous faudra configurer les métriques load_5 puis load 15 comme les captures d’écran ci-dessous.

Résumons, nous avons modifié les 3 métriques suivantes: load_1, load_5 et load_15. Nous avons aussi configuré le remplissage des graphiques pour chaque métriques et donné un ordre précis d’affichage à savoir load_1, load_2 et load_5.

Comme toutes les modifications concerne que Centreon, aucun redémarrage de Nagios ne sera nécessaire et les modifications seront pris en compte directement. Visualisons à présent le résultat de nos modifications.

Vous pourrez constater que l’affichage est beaucoup plus « jolie » et le graphique de l’indicateur plus lisible à mon sens.

Maintenant que nous savons comment empiler des métriques sur un graphique, nous allons voir comment choisir les couleurs des aires et des lignes des graphiques. Pour ce faire, il faudra se rendre dans le menu « Views>Graphs>Curves« . Par exemple pour personnaliser les couleurs du graphique de la métrique « connection_time« , il faudra cliquer sur le nom de la métrique pour la modifier.

Pour modifier la couleur de la  ligne du graphique il faudra changer la valeur du champ « Line color« ;

Pour modifier la couleur de l’air du graphique, il faudra changer la valeur du champ « Area color« ;

Si vous modifier la valeur du champ « Area color, » n’oubliez pas de cocher la case « Filling » (remplissage) au sinon votre modification ne sera pas pris en compte.

Vous pouvez aussi ajouter une légende, en ajoutant votre texte dans le champ « Legend Name« .

Voici un exemple de configuration, de la métrique connection_time.

C’est la fin de cet article, en espérant que ces petites astuces vous plairont et rendront service. ;-)


Comment superviser des bases de donnnées Oracle avec CES ou FAN ?

Vous avez certainement eu besoin de superviser des bases de données Oracle avec Nagios/Icinga/Centreon mais vous n’avez pas trouvé de solution concrète. Pas de panique il y a une solution assez simple à mettre en oeuvre, dans cette article nous allons vous décrire les différentes étapes pour superviser vos bases de données Oracle.

Choix du plugin

Dans un premier temps nous utiliserons le plugins check_oracle_health qui fournit des métriques intéressantes. Pour plus d’informations sur ce plugins, cliquez sur le lien suivant:

http://labs.consol.de/lang/de/nagios/check_oracle_health/

Ce plugin doit être compilé et pour l’installer il faut entrer les commandes suivantes:

root@central-centreon:~# tar -xvf check_oracle_health-1.7.3.tar.gz
root@central-centreon:~# cd check_oracle_health-1.7.3
root@central-centreon:~# ./configure --program-prefix=plugins/ --libexecdir=/usr/lib/nagios --with-mymodules-dir=/usr/lib/nagios/plugins  --with-statefiles-dir=/tmp
root@central-centreon:~# make
root@central-centreon:~# make install

Le plugin check_oracle_health a été installé et se trouve dans le répertoire /usr/lib/nagios/plugins/.

Installation des Pré-requis pour utiliser le plugin

root@central-centreon:~# yum install libdbi-drivers
root@central-centreon:~# yum install libdbi
root@central-centreon:~# yum install perl-DBI

Il faudra installer aussi installer Oracle instant client, la liste des paquets est la suivante:

  • oracle-instantclient-basic;
  • oracle-instantclient-devel;
  • oracle-instantclient-jdbc;
  • oracle-instantclient-sqlplus;

Pour information, aujourd’hui deux versions disponible en téléchargement, à savoir Oracle instant client 11.2 et 10.2.0.5. La version 11.x est rétro-compatible jusqu’à Oracle 9 et la version 10.x est rétro-compatible jusqu’à Oracle 8. Ces paquets sont disponible en téléchargement sur le site de l’éditeur.

Une fois les différents paquets Oracle instant client installé, il faudra installer la librairie perl DBD-Oracle. Pour ce faire il vous faudra télécharger DBD-Oracle sur CPAN puis le copier sur votre serveur de supervision.

Avant de décompresser l’archive, il faudra créer quelques variable d’environnement pour DBD-Oracle. Editez le fichier /etc/profile de votre système d’exploitation pour y ajouter les lignes suivantes:


ORACLE_HOME=/usr/lib/oracle/10.2.0.5/client64
PATH=$PATH:$ORACLE_HOME/bin
LD_LIBRARY_PATH=$ORACLE_HOME/lib/
export ORACLE_HOME
export PATH
export LD_LIBRARY_PATH

Pour la variable ORACLE_HOME, il vous suffit de la compléter de la façon suivante /usr/lib/oracle/version-oracle/client-architecture. Dans l’exemple ci-dessus, il s’agit de Oracle instant client 10.2.0.5 sur une architecture 64 bit.

root@central-centreon:~# tar -xvf DBD-Oracle-1.44.tar.gz
root@central-centreon:~# cd DBD-Oracle-1.44
root@central-centreon:~# perl Makefile.PL
root@central-centreon:~# make
root@central-centreon:~# make install

Maintenant que DBD-Oracle est installé, nous allons nous connecté avec l’utilisateur Nagios pour tester notre plugin avant de la rajouter dans Centreon.

root@central-centreon:~# su - nagios

nagios@central-centreon:~% /usr/lib/nagios/plugins/check_oracle_health --connect='(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=192.168.122.21)(PORT=1531))(CONNECT_DATA=(SID=sidoracle)))' --username=nagios --password=nagiossecret --mode=tnsping --warning=60 --critical=600
OK - connection established to (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=192.168.912221)(PORT=1531))(CONNECT_DATA=(SID=sidoracle))).

Il semblerait que tout soit fonctionnel, il ne vous reste plus qu’à rajouter les commandes et modèles nécessaires dans Centreon pour superviser vos base de données Oracle.


Nouvelle version de Nagios Plugins

La sortie de la version de Nagios Plugins 1.4.16 a été annoncé il y a quelques heures. Vous pouvez consulter le changelog en cliquant sur le lien suivant:

http://nagiosplugins.org/nagiosplugins-1.4.16

Cette nouvelle release arrive quasiment deux ans après la 1.4.15 qui était sortie le 27 juillet 2010.  Cela peut « réconforter » les personnes qui comme moi était surpris et se posaient des questions sur après le départ de Ton Voon le 4 novembre 2011. Pour rappel Ton Voon a été le leader du projet Nagios Plugins pendant 7 ans.

L’archive est disponible en téléchargement en cliquant sur le lien suivant:

http://sourceforge.net/projects/nagiosplug/files/

A mon vis elle sera testé puis packagé prochainement (si tout se passe bien) dans les distributions comme FAN ou encore CES.


[BUG] ATTENTION à la version de NDOutils utilisé avec Centreon

Pour ce qui ne l’aurait pas remarqué, il y a deux nouvelles versions de NDO qui ont été publié depuis le début de l’année 2012 (NDOutils 1.5 et 1.5.1). A la grande surprise ces deux versions sont « stables », pour ceux qui utilisent ce addon de Nagios depuis assez longtemps c’est étonnant quand on sait que la version 1.4 beta 9 a été installée en production pendant longtemps.

La version de NDO 1.5 n’est pas compatible avec Centreon, donc il faudra penser à ne pas mettre à jour NDOutils sur votre plate-forme. Pour information, ce problème de compatibilité a été remonté sur la forge de  Centreon, vous pouvez lire le ticket en cliquant sur le lien suivant:

http://forge.centreon.com/issues/3076

Un des développeurs de Centreon a fait plusieurs tests et n’a pu que constater le problème de « provisionning » de la base de données de NDO qui gère la supervision en temps réelle dans Centreon. Qui dit Supervision en temps réelle, dit aussi statut des hôtes et des services.

Si vous avez NDOutils et que vous constatez des problèmes de performances, je vous recommande d’utiliser la version patché de NDO. Effectivement lorsque que NDO a été développé, il semblerait que certains optimisations comme l’utilisation des indexes aient été oubliés. En installant la version patchée vous pourrez alors bénéficier de ces optimisations.

Pour plus d’informations sur la version de NDO patché, je vous invite à cliquer sur le lien suivant:

http://forum.centreon.com/showthread.php/10287-Passage-NDO-en-version-SVN-NDO-%28Patch-NDOutils%29

Si vous utilisez Fully Automated Nagios ou encore Centreon Enterprise Server vous bénéficiez déjà de cette optimisation.


Comment mettre en place des traps SNMP avec Centreon

Comme vous le savez certainement, la mise en place de traps SNMP n’est pas chose facile. Le but de cet article permet de vous guider à travers un cas pratique que vous pourrez appliquer à un autre contexte.

Avant de créer notre service passif, nous allons crée un modèle de service passif. Pour ce faire il faudra se rendre dans le menu Configuration=>Services=>Templates puis créer un nouveau template en cliquant sur « Add ». Il vous faudra ajouter les informations comme dans le screenshot ci-dessous:

Dans ce modèles nous avons créer une commande qui renvoie toujours OK (check_dummy) et avec le code de retour zéro donc qui sera toujours en OK. Effectivement c’est notre trap qui enverra une alerte et donc changera le status du service. Il ne faudra pas oublier de cocher la case « Is volatile » à « Yes » pour être notifié du changement de statut (OK à CRITICAL).

Dans cette exemple les notifications ne sont pas activées mais si vous utilisez ce mécanisme pour être alerté en cas de changement de statut, il faudra l’activer.

Nous pouvons aussi ajouter un « contrôle de fraîcheur », effectivement dans le cadre de la supervision passive l’échange est unidirectionnelle. C’est à dire que c’est la ressource supervisé qui va envoyé son état (en cas d’interruption événementielle) au serveur de supervision. Ce contrôle de fraîcheur permet de s’assurer que nous avons bien le dernier état de notre ressource supervisé, en lançant le check_dummy à intervalle régulier. Cette intervalle régulier est la valeur du paramètre « Freshness Threshold ».

Ces deux paramètres se configurent dans l’onglet « Data Processing », comme dans l’onglet ci-dessous:

Voilà notre modèle de service passif a été crée. Maintenant nous allons créer notre service, et pour ce faire il faudra se rendre dans le menu Configuration=>Services.

Nous allons créer un service nommé « trap-test-2″, les paramètres ajoutés sont ceux présents dans le screenshot ci-dessous:

Vous remarquerez que vous avons mis un contrôle actif toute les heures car Nagios refuse de créer un service sans intervalle de contrôle. Puis nous allons relier une trappe de la catégorie « générique » à notre service. Pour ce faire nous irons dans le menu relation et allons rajouter notre serveur « Centreon-Server » puis notre trappe « ColdStart ». Pour information ColdStart signifie que le service snmpd redémarre. Donc le but de cette trappe SNMP est de nous avertir lorsque le service snmpd redémarre. Vous pouvez voir l’onglet relation ci-dessous:

Une fois notre service enregistré, il ne faudra pas oublier de générer les traps, pour ce faire Configuration=>Nagios=>Snmp traps.

Une fois les trappes générés, il faudra générer la configuration de Nagios, pour ce faire Configuration=>Nagios.

Une fois la configuration de Nagios généré nous allons démarrer le service snmptrapd, puis nous simulerons la réception d’une trappe.

Dans votre terminal, il faudra lancer la commande suivante:

root@central-centreon:~# snmptrap -v2c -c public 127.0.0.1 0 .1.3.6.1.6.3.1.1.5.1 .1 s ''

Vous vous apercevrez que le service test-trap-2 change de statut et passe en WARNING.

Voilà vous avez mis en place un service passif avec traps SNMP sur votre serveur Centreon.


Un nouveau lead pour le projet FAN

FAN est une distribution linux (basé sur une CentOS) orientée supervision. Cette solution s’installe rapidement et propose de nombreux outils tels que Nagios, Centreon, Nareto, Nagvis, …

Le développement du projet s’était peu à peu ralentit depuis ces derniers mois par manque de temps de la part des développeurs.

Le leader du projet, Cédric Temple, a décidé de passer les rênes au développeur le plus actif du projet qui est Olivier LI-KIANG-CHEONG (LKCO).

Cédric Temple confie les clés de la maison à LKCO, pour les raisons suivantes:

  • LKCO continue à développer FAN;
  • LKCO répond aux questions des utilisateurs sur le forum;
  • LKCO propose et met en oeuvre des nouvelles idées;

Olivier LI-KIANG-CHEONG prévoit de sortir une nouvelle version de F.A.N, on attend avec impatience la roadmap qui mijote dans son grimoire.

Pour de plus d’informations, je vous invite à lire l’article du blog de Cédric Temple en cliquant sur le lien suivant:

http://cedrictemple.net/dotclear/post/2011/02/21/LKCO-devient-le-nouveau-responsable-de-FAN-Fully-Automated-Nagios


Solution linux 2011

Monitoring-fr sera présent au salon solution linux (10 au 12 mai au cnit paris la défense) avec les équipes de FAN et Shinken-Monitoring.


  • A quand un /dev/cloud sur nos serveurs ? #Cloud #cloudsucks2 hours ago via Twitter for iPad
  • Bon les gars faut arrêter les tests maintenant on veut du soleil. #LT #cloudsucks #cloud3 hours ago via Twitter for iPad
  • Certains disaient que le #cloud à la française n'avait pas d'avenir, on a la preuve que ça marche vu le temps. #andromede3 hours ago via Twitter for iPad
  • @lolokai le bon plan quoi :-) cc @Cedric_Temple3 hours ago via Twitter for Android
  • Non mais vous avez quoi a placer le mot #Cloud partout ? #wakeup #realtalk #wtf12 hours ago via Twitter for iPad
  • A force de mettre le mot #Cloud dans toutes les conversations, les nuages restent et on a un ciel tout gris. Merci le #Cloud12 hours ago via Twitter for iPad

  • Copyright © 2010-2013 Charles JUDITH. All rights reserved.
    Jarrah theme by Templates Next | Powered by WordPress