Oracle Cluster Health Monitor (aka IPD/OS) permet de surveiller et diagnostiquer des problèmes sur les noeuds d’un cluster. Si le produit fait son apparition dans la documentation d’Oracle 11g Release 2 (aka 11gR2), il fonctionne avec les versions antérieures d’Oracle. En fait, il fonctionne même si vous n’utilisez pas de cluster. Dans cet article, vous trouverez quelques trucs pour installer l’infrastructure de collecte des informations sur les serveurs, ainsi que le client Java. Vous pourrez alors afficher l’interface graphique qui liste tous les serveurs du cluster et vous disposerez d’une ligne de commande ipd> pour descendre dans le détail comme ci-dessous :
Installer Cluster Health Monitor sur les serveurs
Pour installer Oracle Cluster Health Monitor, téléchargez la dernière version sur Oracle Technology Network. Oracle recommande de créer un utilisateur et un répertoire spécifique pour cette installation sur chacun des noeuds du cluster. Lancez la commande useradd
comme sous l’utilisateur root
comme ci-dessous :
useradd -d /home/crfuser -s /bin/bash -u 1301 -g oinstall crfuser passwd crfuser mkdir /u01/app/crfpack chown crfuser:oinstall /u01/app/crfpack
Décompressez ensuite la distribution sur un des serveurs et avec l’utilisateur que vous allez utiliser pour installer le logiciel, comme ci-dessous :
su - crfuser cd ~/crfpack unzip crfpack-linux.zip cd install cat README.txt
Pour installer le logiciel sur l’ensemble des noeuds du cluster, il faut créer une équivalence SSH entre les utilisateurs sur tous les serveurs du cluster. Sur chacun des noeuds, lancez les commandes qui suivent:
su - crfuser ssh-keygen -t rsa ssh-keygen -t dsa cd .ssh for i in node1 node2 node3 node4; do ssh $i "cat .ssh/*.pub" >>authorized_keys done for i in node1 node2 node3 node4; do scp authorized_keys $i:~/.ssh/authorized_keys ssh $i "chmod 600 ~/.ssh/authorized_keys" done for i in node1 node2 node3 node4; do for j in node1 node2 node3 node4; do ssh $i ssh $j date done done
Une fois l’équivalence SSH paramétrée, vous pouvez installer le logiciel depuis le premier noeud du cluster (éventuellement, vous devrez commencer par supprimer l’installation précédente) :
cd ~/crfpack/install ./crfinst.pl -i node1,node2,node3,node4 -b /u01/app/crfpack -m node1
Sur chacun des serveurs et sous l’utilisateur root, activez le service associé à Cluster Health Monitor :
su - /u01/app/crfpack/install/crfinst.pl -f
/etc/init.d/init.crfd enable /etc/init.d/init.crfd status
Installer le Client du Cluster Health Monitor
Pour installer le client Oracle Cluster Health Monitor, vous utiliserez la même distribution que sur le serveur, cette fois sur un poste client. Pour effectuer l’installation sur Linux, le plus simple est d’utiliser le script perl sous l’utilisateur root
:
su - cd ~/crfpack/install ./crfinst.pl -g Installation completed sucessfully at /usr/lib/oracrf...
Pour démarrer l’interface, configurer le serveur X et lancez l’application comme ci-dessous :
cd /usr/lib/oracrf/bin ./crfgui -h ./crfgui -m node1
Utiliser Oracle Cluster Health Monitor
Oracle Cluster Health Monitor permet de descendre dans le détail des composants que vous pouvez superviser. Tapez la commande help
dans la ligne d’interface ipd>
pour connaître toutes les commandes disponibles. Vous pourrez, par exemple, descendre dans le détail de l’utilisation du serveur avec la commande node node1
où node1
indique le nom du serveurs que vous voulez examiner. Une fenêtre comme celle ci-dessous apparaîtra :
Oracle Cluster Health Monitor conserve les informations collectées sur les serveurs dans des fichiers Berkeley DB. Vous pouvez donc afficher l’historique des différentes mesures grâce à l’option -d
de la commande crfgui
; En plus de l’interface graphique, le client offre également une interface en mode ligne de commande nommée oclumon
. Pour en savoir plus, utilisez le paramètre -h
et lisez les différents fichiers README dans la distribution et sur la page OTN d’Oracle Cluster Health Monitor.
4 réflexions sur “Oracle Cluster Health Monitor (IPD/OS)”
Bonjour, je ne vois pas vraiment l’intérêt comparé à la solution Grid Control ?
En effet la solution 10.2.0.4 et 10.2.0.5 propose déjà un niveau de détail impressionnant.
Cordialement,
Huet Bruno.
Bruno,
Vous avez raison : les options d’Enterprise Manager pour les serveurs ou les VM comme « Enterprise Manager System Monitoring Plug-in for Linux/Unix/Windows » sont très intéressantes pour superviser les systèmes et faire du capacity planning ?
Oracle Cluster Health Monitor, RACDDT, OS Watcher sont quant à eux plus orientés vers les diagnostiques de problèmes. Par exemple, comme vous le voyez sur l’écran, Cluster Health Monitor historise les top processes ce qui peut-être assez utile à connaître lorsqu’un système perd les pédales. OEM ne fait pas ça à ma connaissance.
Pour ajouter à cette richesse, vous avez des outils OS comme sysstat (sar) et collectl sous Linux et d’autres outils sur les differentes plateformes.
Ce qui est intéressant dans toute cette richesse, outre le fait que vous avez le choix, c’est qu’on ne manque pas de travail pour positionner la meilleure solution pour un besoin précis.
Excellent post, Gregory. Any idea why this isn’t integrated into Grid?
My guess is that it’s because that’s not the same team in charge. But it’s just a guess.
Les commentaires sont fermés.