Supervision : piloter la crise, ne plus la subir

Retour à l’actualité

 

Que faire lorsque le centre de données hébergeant la supervision qui le supervise, subit une panne incomplète ou totale ? De multiples logiques peuvent être mises en œuvre.

En premier lieu, considérer un service SaaS de supervision peut être la solution : la surveillance est effectuée au plus près des éléments à superviser, mais la restitution et le suivi sont effectués sur une application, web ou mobile, externe au Système d’Information, et pour laquelle un SLA de disponibilité est opérationnel, avec des acteurs spécialisés et mobilisés pour l’atteindre.

La suite de ce billet traitera donc les plateformes de supervision on premise.

Traditionnellement, les implémentations se basent sur une réplication / synchronisation des machines virtuelles assurant le service en tirant parti des technologies inhérentes à toute solution de virtualisation ou d’hyper-convergence. En dépit de toutes les précautions prises, et des prouesses technologiques en ce domaine, un problème technique ou opérationnel peut entraîner une indisponibilité de la supervision.

Il peut également arriver que les Clients demandent une haute disponibilité applicative sur deux centres de données. Cette seconde approche implique une architecture logicielle spécifique sur l’ensemble des couches fonctionnelles : accès des utilisateurs, communication bidirectionnelle entre les superviseurs et la plateforme centrale, stockage des données, analyse. Elle implique surtout des prérequis très forts sur les centres de données : liaison dédiée inter-sites constamment disponible, latence réseau entre les sites inférieure à 5ms.

Le produit ServiceNav propose une telle architecture.

Ces approches sont coûteuses, complexes, et dans les faits rarement mises en œuvre.

Soyons provocateurs : en cas de désastre informatique, quelle sera la priorité du responsable du Centre de Données ? Assurer la continuité opérationnelle de la supervision, ou en premier lieu maintenir ou rétablir la disponibilité des applications ?

En cas de désastre informatique total, la première priorité est de comprendre ce qu’il se passe : la supervision joue ici un rôle crucial dans la contextualisation de la panne rencontrée, et ne doit donc pas être indisponible.

Essayez gratuitement 30 jours

 

L’architecture ServiceNav fournit de façon native cette visibilité en cas de panne complète ou partielle du centre de données hébergeant la supervision, impactant celle-ci.

 

Le principe est le suivant, la mise en œuvre simple et très rapide :

  1. Installer dans le centre de données de secours un superviseur et le connecter au site Web ServiceNav – 15 minutes
  2. Définir avec précision l’ensemble des contrôles nécessaires pour déterminer l’état du centre de données nominal :
    • Les points de contrôles sur tous les composants de la supervision
    • Les points de contrôle sur les composants d’infrastructure : réseau, stockage, serveur, hypervision
    • Les relations de dépendance entre ces points de contrôle
  3. Mettre en service l’interface Web locale sur ce superviseur, permettant de visualiser l’ensemble des contrôles placés sous la responsabilité de ce superviseur – 15 minutes

 

Par ce biais, en cas de panne impactant totalement ou partiellement le site Web central de supervision, vous conservez la visibilité sur les contrôles essentiels.

Dans le détail : ici.

Vous souhaitez en savoir plus ? Contactez nous ici !

Essayez gratuitement 30 jours

Comment les nouvelles technologies dans le domaine du bigdata et de l'intelligence artificielle bouleversent les usages de la supervision IT et IoT, et ouvrent de nouvelles opportunités aux clients et utilisateurs ServiceNav ?

Articles les plus récents

22/5/19

La scalabilité de la plateforme, élément indispensable lors du choix d’une solution de supervision.

Historiquement la plupart des solutions de supervision sont basées d’une part sur un pooler en charge de la collecte des informations et d’autre part sur… Lire la suite

15/5/19

Supervision et changements, destins croisés

L’essentiel La gestion de changements s’avère très complexe, avec des impacts potentiellement très importants en termes de disponibilité, de coûts, de perte de données. La… Lire la suite

7/5/19

La cartographie applicative

Représenter la supervision applicative Superviser des applications peut poser des problématiques de lisibilité des informations, des dépendances et des alertes, lorsqu’il s’agit de mettre en… Lire la suite