Supervision : piloter la crise, ne plus la subir

Retour à l’actualité

 

Que faire lorsque le centre de données hébergeant la supervision qui le supervise, subit une panne incomplète ou totale ? De multiples logiques peuvent être mises en œuvre.

En premier lieu, considérer un service SaaS de supervision peut être la solution : la surveillance est effectuée au plus près des éléments à superviser, mais la restitution et le suivi sont effectués sur une application, web ou mobile, externe au Système d’Information, et pour laquelle un SLA de disponibilité est opérationnel, avec des acteurs spécialisés et mobilisés pour l’atteindre.

La suite de ce billet traitera donc les plateformes de supervision on premise.

Traditionnellement, les implémentations se basent sur une réplication / synchronisation des machines virtuelles assurant le service en tirant parti des technologies inhérentes à toute solution de virtualisation ou d’hyper-convergence. En dépit de toutes les précautions prises, et des prouesses technologiques en ce domaine, un problème technique ou opérationnel peut entraîner une indisponibilité de la supervision.

Il peut également arriver que les Clients demandent une haute disponibilité applicative sur deux centres de données. Cette seconde approche implique une architecture logicielle spécifique sur l’ensemble des couches fonctionnelles : accès des utilisateurs, communication bidirectionnelle entre les superviseurs et la plateforme centrale, stockage des données, analyse. Elle implique surtout des prérequis très forts sur les centres de données : liaison dédiée inter-sites constamment disponible, latence réseau entre les sites inférieure à 5ms.

Le produit ServiceNav propose une telle architecture.

Ces approches sont coûteuses, complexes, et dans les faits rarement mises en œuvre.

Soyons provocateurs : en cas de désastre informatique, quelle sera la priorité du responsable du Centre de Données ? Assurer la continuité opérationnelle de la supervision, ou en premier lieu maintenir ou rétablir la disponibilité des applications ?

En cas de désastre informatique total, la première priorité est de comprendre ce qu’il se passe : la supervision joue ici un rôle crucial dans la contextualisation de la panne rencontrée, et ne doit donc pas être indisponible.

Essayez gratuitement 30 jours

 

L’architecture ServiceNav fournit de façon native cette visibilité en cas de panne complète ou partielle du centre de données hébergeant la supervision, impactant celle-ci.

 

Le principe est le suivant, la mise en œuvre simple et très rapide :

  1. Installer dans le centre de données de secours un superviseur et le connecter au site Web ServiceNav – 15 minutes
  2. Définir avec précision l’ensemble des contrôles nécessaires pour déterminer l’état du centre de données nominal :
    • Les points de contrôles sur tous les composants de la supervision
    • Les points de contrôle sur les composants d’infrastructure : réseau, stockage, serveur, hypervision
    • Les relations de dépendance entre ces points de contrôle
  3. Mettre en service l’interface Web locale sur ce superviseur, permettant de visualiser l’ensemble des contrôles placés sous la responsabilité de ce superviseur – 15 minutes

 

Par ce biais, en cas de panne impactant totalement ou partiellement le site Web central de supervision, vous conservez la visibilité sur les contrôles essentiels.

Dans le détail : ici.

Vous souhaitez en savoir plus ? Contactez nous ici !

Essayez gratuitement 30 jours

Comment les nouvelles technologies dans le domaine du bigdata et de l'intelligence artificielle bouleversent les usages de la supervision IT et IoT, et ouvrent de nouvelles opportunités aux clients et utilisateurs ServiceNav ?

Articles les plus récents

27/6/19

Superviser Azure IaaS, Azure PaaS et son IT Interne : Cas Pratique

L’IT des entreprises est de plus en plus hétéroclite avec des briques en Interne (legacy) et des briques hébergées par des fournisseurs tiers (Cloud). La… Lire la suite

26/6/19

ServiceNav 4.3 – Dashlink, Evolution frise temporelle, Plugins Azure PaaS objects

En résumé Dashlink – Un nouvel horizon pour vos dashboards Dataviz Vous avez besoin de partager une console de supervision avec des clients, internes ou… Lire la suite

20/6/19

La supervision : Proposition d’une feuille de route pour choisir le bon outil – Partie 2

Nous avons vu dans notre article précédent la problématique et méthodologie autour du choix de(s) outil(s) pour la supervision. Voyons maintenant comment mettre ceci en… Lire la suite