RAC Cluster Health Monitor : gestion de l’espace disque occupé par crfclust.bdb

crfclust.bdb est un fichier, qui recueille les statistiques sur le Cluster ainsi que les statistiques de l’OS au moyen du service « Health Monitor Cluster » (CHM) ora.crf.

Si ce fichier devient trop encombrant, il est possible d’en modifier le paramétrage afin d’en réduire la taille maximale atteignable.

Pour cela il faut :

  1. Repérer le nœud maître
  2. Retrouver l’emplacement du fichier
  3. Obtenir la taille du fichier
  4. Arrêter la ressource sur les 2 nœuds
  5. Changer le paramétrage
  6. Supprimer le fichier
  7. Redémarrer la ressource sur les 2 nœuds

1 – Repérer le nœud maître

$GRID_HOME/bin/oclumon manage -get
MASTER Master = rac1

2 – Retrouver l’emplacement du fichier

$GRID_HOME/bin/oclumon manage -get reppath
CHM Repository Path = /u01/app/11.2.0/grid/crf/db/rac1

3 – Obtenir la taille du fichier

$GRID_HOME/bin/oclumon manage -get repsize
CHM Repository Size = 93400

4 – Arrêter la ressource sur les 2 nœuds

crsctl status res ora.crf –init
NAME=ora.crf
TYPE=ora.crf.type
TARGET=ONLINE
STATE=ONLINE on rac1
crsctl stop res ora.crf –init
CRS-2673: Tentative d'arrêt de 'ora.crf' sur 'rac1'
CRS-2677: 'ora.crf' a été arrêté sur 'rac1'
crsctl status res ora.crf -init
NAME=ora.crf
TYPE=ora.crf.type
TARGET=OFFLINE
STATE=OFFLINE

5 – Changer le paramétrage

Facultatif : modification de l’emplacement : 
             $GRID_HOME/bin/oclumon manage -repos reploc /nfs1/oltp/chm
Changement de la durée de conservation en secondes :
$GRID_HOME/bin/oclumon manage -repos resize 43200
rac1 --> retention check successful
rac2 --> retention check successful
New retention is 43200 and will use 754099200 bytes of disk space

Cette dernière commande a pour effet de changer la valeur du paramètre BDBSIZE dans le fichier $GRID_HOME/crf/admin/crf<hostname>.ora
6 – Supprimer le fichier

cd $GRID_HOME/crf/db/rac1
rm -f $GRID_HOME/crf/db/rac1/*.bdb

7 – Redémarrer la ressource sur les 2 nœuds

crsctl start res ora.crf –init
CRS-2672: Tentative de démarrage de 'ora.crf' sur 'rac1'
CRS-2676: 'ora.crf' a été démarré sur 'rac1'
crsctl status res ora.crf -init
NAME=ora.crf
TYPE=ora.crf.type
TARGET=ONLINE
STATE=ONLINE on rac1

N.B. Le Bug 20186278 – « crfclust.bdb Becomes Huge Size Due to Sudden Retention Change » modifie tout seul la durée de conservation à 1094795585 !!! Ce qui a pour effet d’avoir un fichier crfclust.bdb pouvant atteindre plusieurs Go alors que la valeur par défaut est la plus petite des valeurs entre 1Go et 3600s.