Comment superviser VMware ?

Fonctionnement de la supervision VMware

La supervision des environnements VMware passe par des webservices. Il faut donc que la ServiceNav Box soit capable d’accéder en https aux webservices. Les hyperviseurs et le vCenter fournissent chacun des webservices.

Pour récupérer les informations des ces webservices, il est recommandé de créer un utilisateur en read only sur les hyperviseurs et dans la console vCenter.

Une fois l’utilisateur créé dans les hyperviseurs et le vCenter, il faut le renseigner dans la section : “Configuration Supervision”, menu : “Général” puis “Compte supervision”. On ajoute le compte VMware avec l’utilisateur créé ci-dessus.

Important : Dans le cas où les hyperviseurs sont gérés par un vCenter, la supervision des datastores doit se faire en déployant le modèle de service : “VMware-Datacenter-Datastore” par datastore à superviser, rattaché à l’équipement vCenter.

La mise à jour des données concernant le taux de remplissage des datastore se fait toutes les 30 minutes côté vCenter. Du côté des hyperviseurs, la mise à jour est aléatoire et la supervision n’est alors pas fiable.

Supervision du vCenter

Créer un compte de supervision : VMware vCenter

Supervision des ESX(i)

Configuration

Créer un compte de supervision : VMware

Services unitaires

VMware-ESX-CPU Mesure la charge CPU à un instant donné en pourcentage, et notifie lors d’un dépassement de seuil (alerte et critique).
VMware-ESX-DiskIO-Read Test la latence en lecture des disques sur les ESX/ESXi et remonte les informations. Notifie lors d’un dépassement de seuil.
VMware-ESX-DiskIO-Write Test la latence en écriture des disques sur les ESX/ESXi et remonte les informations. Notifie lors d’un dépassement de seuil.
VMware-ESX-Hardware Vérifie l’état des éléments matériels (ventilateurs, disques, blocs d’alimentation, etc) d’un serveur VMWare ESX. Prérequis: installer les plugins VMWARE disponibles chez les constructeurs (HP Insight Manager, Dell’s Open Manage, IBM IMM).
VMware-ESX-NetUsage Mesure l’utilisation des interfaces réseau d’un serveur ESX.
VMware-ESX-RAM Mesure l’utilisation de la RAM d’un serveur ESX et notifie lors d’un dépassement de seuil.
VMware-ESX-Runtime_Issues Affiche la liste de tous les incidents en cours sur l’hôte de virtualisation.
VMware-ESX-Runtime_status Indique l’état général de l’hôte de virtualisation au moyen de quatre codes de statut: gray / green / red / yellow.
VMware-ESX-Services Vérifie l’état des services d’un hôte ESXi indiqués en paramètre et passe à l’état CRITIQUE quand au moins un service de cette liste n’est pas démarré.
VMware-ESX-Services-WithExclusion Vérifie l’état des services d’un hôte ESXi devant être démarrés excepté ceux placés en paramètre et passe à l’état CRITIQUE quand au moins un service n’est pas démarré.
VMware-ESX-SWAP Mesure l’utilisation de l’espace de swap d’un serveur ESX/ESXi et notifie lors d’un dépassement de seuil.
VMware-ESX-VM-List Liste les machines virtuelles présentes sur cet ESX et indique leur statut (UP / DOWN). Le statut du modèle de service ne change pas si le statut d’une machine virtuelle change.

Supervision des VM

Configuration

  • Créer un compte de supervision : VMware vCenter
  • Indiquer le nom du vCenter
  • La supervision des VMs passe par le vCenter. Le nom de l’équipement supervisé dans ServiceNav doit être identique à celui dans VMware.

Services unitaires

VMware-Datacenter-VM_ActiveRAM Mesure l’utilisation de la mémoire active consommée par une VM, en interrogeant le vCenter. Ce contrôle notifie lors d’un dépassement de seuils exprimés en Mo.
VMware-Datacenter-VM_Balooning Mesure l’utilisation de la mémoire par le driver de contrôle de mémoire d’une VM en interrogeant le vCenter et notifie lors d’un dépassement de seuils exprimés en Mo.
VMware-Datacenter-VM-ConfigIssues Détecte des problèmes de configuration d’une VM en interrogeant le vCenter.
VMware-Datacenter-VM-ConnectionState Collecte l’état de connexion d’une VM en interrogeant le vCenter et change d’état si son état n’est pas OK.
VMware-Datacenter-VM_CPU Mesure l’utilisation du CPU d’une VM en interrogeant le vCenter et notifie lors d’un dépassement de seuil.
VMware-Datacenter-VM_CPUReady Mesure l’utilisation du temps libre CPU d’une VM en millisecondes en interrogeant le vCenter et notifie lors d’un dépassement de seuil. Le temps libre CPU est la durée pendant laquelle le CPU d’une machine virtuelle est prêt pour exécution et en attente au niveau d’un CPU physique.
VMware-Datacenter-VM_CPUWait Mesure l’utilisation du temps en attente CPU d’une VM en millisecondes en interrogeant le vCenter et notifie lors d’un dépassement de seuil. Le temps en attente CPU est la durée pendant laquelle le CPU d’une machine virtuelle est en attente de ressources plus le temps passé sans activité.
VMware-Datacenter-VM_DiskIO-Read Mesure l’utilisation des IO disque en lecture par une VM, en interrogeant le vCenter. Ce contrôle notifie lors d’un dépassement de seuils exprimés en Mo/s.
VMware-Datacenter-VM_DiskIO-Write Mesure l’utilisation des IO disque en écriture par une VM, en interrogeant le vCenter. Ce contrôle notifie lors d’un dépassement de seuils exprimés en Mo/s.
VMware-Datacenter-VM-GuestStatus Collecte l’état de fonctionnement de l’OS invité d’une VM en interrogeant le vCenter et change d’état si son état n’est pas OK.
VMware-Datacenter-VM_NetUsage Mesure l’utilisation du réseau par une VM, en interrogeant le vCenter. Ce contrôle notifie lors d’un dépassement de seuils exprimés en kilo-octets par seconde.
VMware-Datacenter-VM_OverheadRAM Mesure l’utilisation de la mémoire additionnelle par une VM en raison de la virtualisation des ressources, en interrogeant le vCenter. Ce contrôle notifie lors d’un dépassement de seuils exprimés en Mo.