Le dépannage des réseaux et des applications est peut-être l’activité la plus critique à laquelle doivent répondre les équipes IT. A mesure que le temps de résolution des problèmes augmente, la pression augmente sur l’équipe IT la lenteur du réseau et des applications étant lié aux temps d’arrêt.
Selon le rapport d’Enterprise Management Associates « Network Management Megatrends 2016 » les équipes informatiques consacrent environ 36% de leurs efforts quotidiens à la recherche réactive de pannes. C’est pourquoi, des efforts ont été déployés au fil des ans pour réduire le Temps Moyen de Réparation (MTTR). Malheureusement, selon ZK Research, 85% du MTTR est utilisé uniquement pour essayer de comprendre qu’il y a effectivement un problème.
Et s’il y avait un meilleur moyen ? Un moyen qui permettrait de :
- Potentiellement réduire le MTTR jusqu’ à 80%.
- Exposer les angles morts du réseau.
- Éliminer les blocages techniques inutiles pour le dépannage.
- Éliminer les blocages de processus inutiles pour le dépannage.
Voici cinq des principales activités que les professionnels de l’informatique peuvent mettre en œuvre pour améliorer les efforts de dépannage de leur entreprise.
1 – Insérer des TAP entre le réseau et les outils de surveillance (ou NBP – Network Packet Brokers) pour améliorer la qualité des données de surveillance et le temps d’acquisition des données.
Une fois que les TAPs et les NPBs sont insérés dans le réseau, les modifications l’affectant (pour collecter les données de dépannage) sont pratiquement éliminées, en supposant que le déploiement ait été effectué correctement. Les TAPs sont des dispositifs passifs qui, contrairement aux ports SPAN, fournissent une copie complète de toutes les données réseau, y compris les paquets corrompus et malformés (qui peuvent aider dans les activités de dépannage). Les outils de sécurité et de surveillance peuvent ensuite être connectés aux NPBs à volonté. Cela peut considérablement accélérer le diagnostic des pannes car de nombreuses approbations du Change Board peuvent être éliminées. Les conseils de changement régissent généralement le réseau de production et supervisent les activités qui peuvent ou non être mises en œuvre dans le réseau. C’est pour une bonne raison, car ces changements provoquent souvent des interruptions et des pannes de réseau. Grâce à la nouvelle configuration du TAP et du NPB, le service informatique peut souvent commencer immédiatement les activités de dépannage sans affecter le réseau. Désormais, il n’est plus nécessaire d’attendre des minutes, des heures ou des jours pour obtenir l’autorisation de connecter un équipement de diagnostic au réseau, car il est déjà connecté et prêt à fonctionner.
2 – Déployer des NPBs entre ces TAPs et les outils de sécurité et de surveillance pour optimiser les données envoyées.
Une deuxième conséquence de l’ajout d’un NPB est la capacité à optimiser le filtrage des données et à réduire (ou éliminer) la nécessité des crash carts. Le filtrage des données élimine les données inutiles qui augmentent le temps jusqu’ à la résolution par les outils de surveillance. De plus, le NPB donne un accès instantané aux données et aux outils dont on a besoin. Cela permet d’accélérer considérablement le diagnostic des pannes, car les crash carts (chariots spéciaux avec un ensemble d’outils de triage et de dépannage) ne sont plus nécessaires : les outils sont pré-connectés au NPB. Cela élimine le temps passé à les localiser, les déplacer au bon endroit et les insérer dans le réseau, et réduit ainsi le temps de configuration des outils. Ce peut être particulièrement pertinent si le dépannage nécessite d’être effectué sur des liaisons et des équipement éloignés. Des réductions de MTTR allant jusqu’ à 80% sont possibles simplement grâce à l’élimination des autorisations du Change Board et des crash carts.
3 – Déployer des NPBs qui prennent en charge les filtres flottants pour réduire davantage le temps d’acquisition des données.
Une troisième solution que l’on peut mettre en œuvre, selon le choix de NPB, consiste à utiliser des filtres flottants. Il s’agit de filtres NPB spécifiques pour le dépannage qui peuvent être pré-établis et connectés à des outils de dépannage de secours (par exemple, analyseurs, Wireshark, Snort). Une fois mis en œuvre, ces filtres de pré-étapes peuvent réduire considérablement les temps de collecte des données, car le filtre de dépannage doit simplement être connecté à un port réseau entrant du NPB. Cela peut être fait à distance en utilisant une interface glisser-déposer sur le NPB. Une fois la connexion établie, l’outil peut commencer à capturer les données critiques en moins d’une minute, ce qui réduit considérablement le temps et les coûts de dépannage.
4 – Utiliser des NPB qui prennent en charge la surveillance adaptative, ce qui accélère le processus de déploiement des filtres de données en utilisant l’automatisation pour remplacer l’intervention manuelle.
On peut envisager le déploiement de NBP appuyant la surveillance adaptative. La surveillance adaptative est la capacité du NPB à répondre aux commandes du réseau et à effectuer des changements de configuration. Cette capacité d’automatisation améliore le suivi des temps de réponse en permettant de répondre aux incidents réseau par des actions en temps quasi réel. Les commandes peuvent être reçues à l’aide d’une interface de transfert d’états représentatifs (REST) à partir de systèmes de gestion de réseau (NMS), de systèmes d’orchestration, d’informations de sécurité et de gestion d’événements (SIEMs), etc. Des réponses plus rapides aux problèmes permettent d’obtenir un temps moyen de diagnostic plus court et donc un MTTR plus rapide.
5 – Mettre en œuvre un dépannage proactif avec intelligence applicative pour créer une approche de dépannage macroscopique qui réduit le temps de localisation des pannes.
Enfin, pour améliorer le MTTR on peut mettre en œuvre un dépannage proactif en utilisant l’intelligence applicative au sein du NPB. L’intelligence applicative utilise les données liées aux applications pour examiner des informations supplémentaires sur les données réseau. La géolocalisation de l’utilisateur, le type d’appareil, le type de navigateur, les informations d’affectation du protocole de passerelle frontière (BGP AS) et les informations de modification du trafic applicatif peuvent être utilisés pour aider à identifier les problèmes. Si cette information est examinée conjointement avec les rapports d’incidents de panne, cela peut souvent raccourcir le temps de dépannage. Par exemple, le problème touche-t-il tous les périphériques ou systèmes d’exploitation ou seulement certains d’entre eux ? Les incidents sont-ils signalés par région géographique ? L’incident est-il lié à un transporteur particulier ou à un fournisseur de services Internet ? Ces points de données peuvent être très utiles pour diagnostiquer les problèmes.
L’utilisation de ces cinq cas d’utilisation peut considérablement améliorer les efforts de dépannage en réduisant le temps consacré à la résolution des problèmes. La réduction du temps de résolution des problèmes réduit les temps d’arrêt du réseau et aide le personnel informatique à respecter ou à dépasser les indicateurs de temps de résolution des problèmes.
___________
Keith Bromley est Senior Solutions Marketing Manager d’Ixia