La gestion hors bande réduit les temps moyens de rétablissement (MTTR) dans les environnements IT distribués.
Où se trouvent mes équipements ? La vague de transformations apportées par la numérisation, l’Internet des Objets, les environnements et les systèmes matériels de plus en plus décentralisés, voilà qui propose de nouveaux défis aux départements informatiques. Ils se retrouvent à gérer les environnements des réseaux distribués pour les filiales et les agences, les sites de production et les clouds privés afin de maintenir une connectivité permanente et éviter les coûts que génère une interruption du réseau. Cette fonction est aujourd’hui presque toujours centralisée au data center du siège de l’entreprise. Mais, cela pose une vraie question : les limites de la maintenance à distance traditionnelle sont rapidement atteintes si le réseau principal (intra-bande) est défaillant ou si la connectivité Internet n’est pas assurée par le fournisseur de services.
Dans une approche classique, un technicien doit être dépêché sur site. Une fois sur place, celui-ci peut par exemple résoudre le problème via un simple redémarrage ou aller jusqu’à la commande d’un appareil de remplacement.
La gestion hors bande est l’alternative moderne à l’intervention physique. Indépendamment de la fonction et du type de réseau local, elle permet aux entreprises une connexion à la demande et permanente à leur matériel informatique. Celles-ci pourront effectuer les tests pour déterminer si le problème peut être résolu à distance, renforçant ainsi la résilience informatique pour finalement réduire les temps d’interruption.
Cependant, regardons en détail ce phénomène. Les agences augmentent la couverture d’une entreprise et la création de nouveaux sites est le signe que les affaires vont bien. Il est évident que les infrastructures informatiques distantes augmentent sensiblement la charge et augmentent la responsabilité des administrateurs réseau. La DSI doit s’assurer que les infrastructures sont correctement installées et maintenues. Cela englobe les périphériques réseau tels que les routeurs, les commutateurs, les solutions d’optimisation WAN, les pare-feu et toutes les applications et serveurs distribués. Elle doit intégrer les équipements distants dans la gestion centralisée du réseau, dans l’authentification, l’autorisation et la traçabilité pour en garantir la qualité et la sécurité.
Il est dans la nature des choses qu’un réseau distribué comporte plus de faiblesses et soit donc sujet à un plus grand nombre d’interruptions de services. Et seuls les sites distants les plus importants disposeront d’un expert en informatique sur place. Pourtant à l’heure où les réseaux d’entreprise distribués sont connectés à des données et à services critiques via le cloud, le coût d’une défaillance réseau peut se révéler conséquente pour un magasin ou un simple bureau de vente.
Défaillance du réseau principal ou quand les outils intra-bande tombent en panne
Les administrateurs de la plupart des entreprises sont aujourd’hui capables de gérer efficacement des dizaines, voire des centaines de sites, grâce à la supervision centralisée et à l’accès distant aux ressources distribuées. Des outils intra-bande tels que Telnet (Teletype Network) sont généralement utilisés pour l’accès et la maintenance à distance. Ils dépendent de la disponibilité du réseau. Lorsque des incidents techniques majeurs comme une panne de réseau ou une rupture de connectivité se produisent, l’accès est impossible.
Un seul dysfonctionnement de matériel peut suffire à provoquer plusieurs jours d’interruption. Dans une démarche classique, l’entreprise dépêche un technicien sur place. Il est fréquent que le problème soit résolu en quelques minutes, en redémarrant le matériel incriminé par exemple. Mais dans certains cas, le processus de dépannage n’en est qu’à ses débuts. Quel que soit le problème, le déplacement depuis le département informatique fait perdre un temps précieux ; un temps pendant lequel, soit le personnel ne peut pas travailler de manière productive, soit les systèmes critiques sont inaccessibles, et parfois les deux.
C’est pourquoi la gestion hors bande pour administrer le matériel réseau distant présente un grand intérêt aux yeux des administrateurs réseau des infrastructures distribuées. Ceux-ci conservent le contrôle sur tous les composants, même lorsque les politiques de gestion intra-bande sont défaillantes. C’est aussi une garantie de résilience pour l’ensemble du réseau, sachant que même en cas de défaillance majeure, les administrateurs peuvent rapidement accéder aux réseaux distants.
Solutions hors bande avec basculement cellulaire
Le principe est simple. Les périphériques du réseau sont normalement équipés d’interfaces série qui peuvent être interrogées indépendamment du réseau et donner à l’administrateur une image complète de l’état de l’appareil. De nombreuses fonctions de gestion importantes comme les mises à jour de logiciels internes (firmware), ne sont disponibles que via des interfaces console de type série. Dans le cas où un équipement ne répond plus à une commande, l’administrateur peut redémarrer le matériel via le système de contrôle de l’alimentation électrique.
La gestion hors bande permet aux administrateurs de maintenir et gérer des composants tels que les serveurs, les périphériques WAN, les périphériques réseau et les unités d’alimentation électrique en résolvant les dysfonctionnements via un accès distant. En cas de problème de connectivité, les solutions hors bande offrent une solution de basculement. A l’heure actuelle, cela s’effectue grâce aux connexions cellulaires (4G LTE ou 3G), permettant une connexion rapide. Si la connectivité cellulaire n’est pas suffisamment fiable, les entreprises peuvent utiliser une connexion plus lente via un modem.
La gestion hors bande assure donc aux administrateurs un accès distant continu aux composants critiques, qu’il s’agisse des commutateurs réseau, des routeurs, des unités de distribution électrique, ainsi qu’à un nombre croissant d’applications de sécurité comme les pare-feux et les outils de cryptage. Ces solutions ont montré qu’il n’est généralement pas indispensable de se rendre physiquement sur site et que si cela s’avère nécessaire, le technicien pourra remplacer le composant ou l’équipement et ainsi résoudre rapidement le problème. Le temps moyen de réparation (MTTR) est alors considérablement réduit.
Continuité d’activité du matériel, surveillance automatique et dépannage
Au-delà des crises imposant une intervention urgente, la gestion hors bande présente plusieurs avantages. Elle permet d’identifier et de résoudre automatiquement les problèmes avant même qu’ils n’affectent le trafic local de données. Les solutions les plus récentes intègrent un système de réponse automatique pour corriger les défaillances du réseau en utilisant des outils de diagnostic et de réparation pour les problèmes les plus fréquents.
Des tâches simples peuvent ainsi être effectuées automatiquement, comme par exemple, l’identification d’un routeur ne pouvant pas être contacté, tout en avertissant l’administrateur par SMS ou e-mail et en réalisant le redémarrage de ce routeur. Les serveurs de port console hors bande peuvent être configurés de manière à éteindre correctement les périphériques critiques si la température du rack est trop élevée ou si l’onduleur (UPS) identifie une panne de courant et que les capacités de la batterie tombent en dessous d’un seuil défini.
Un administrateur virtuel pour les matériels
Ces mesures d’auto-dépannage utilisent des scripts de récupération qui s’exécutent sans intervention humaine. En pratique, cela veut dire que la surveillance de l’ensemble de l’infrastructure, c’est-à-dire l’environnement physique (température, humidité, fumée et vibrations) de même que la gestion automatisée de l’alimentation électrique via des capteurs connectés, devient possible. Cette automatisation installe ce que l’on pourrait nommer un administrateur matériel virtuel sur chaque site distribué qui, en plus d’assurer la stabilité du fonctionnement quotidien, réduit les risques d’erreurs humaines et diminue la fenêtre offerte aux cyber-attaques et cyber-sabotage.
L’identification et la résolution rapides des problèmes de connectivité des infrastructures distribuées sont devenues une tâche majeure pour les entreprises. Cela est dû à la complexité croissante des infrastructures IT liée à la communication de machine à machine (M2M), au cloud computing ou à l’Internet des objets, mais aussi au besoin d’éviter les coûts élevés de l’indisponibilité. L’accès à distance sécurisé, via la gestion hors bande, vers les serveurs, les unités WAN, les périphériques réseau et les équipements électriques permet d’identifier et de résoudre de nombreux problèmes avant qu’ils n’affectent les utilisateurs ou les systèmes. Les administrateurs ont besoin d’une structure pour gérer et surveiller l’état des composants distants depuis un emplacement central. Cette solution s’amortit d’elle-même à la suppression du premier appel de service et par les heures d’indisponibilité évitées sur l’ensemble de l’infrastructure.
___________
Dirk Schuma est Sales Manager Europe chez Opengear