Pour les utilisateurs, les applications métiers leur simplifient la vie. En contrepartie, le coût lié à la complexité des applications explose à cause d’une architecture applicative fortement dispersée et interdépendante, qui doit fonctionner et s’actualiser à une vitesse fulgurante. Résultat : identifier un problème, sa cause et le résoudre sont devenus des problèmes en tant que tel.

Albert Einstein a dit un jour que s’il avait une heure pour sauver le monde, il passerait 55 minutes à définir le problème et seulement 5 minutes à trouver la solution. Celles et ceux qui ont déjà travaillé sur une crise informatique savent que 55 minutes est un délai optimiste. Dans un environnement complexe comme celui que nous connaissons aujourd’hui, un problème impactant l’activité peut présenter un ou plusieurs points de défaillance : temps de chargement des pages, renvoi vers des pages web vierges, sites web inaccessibles… Sa résolution repose sur des équipes internes cloisonnées, des centres de services situés dans différents fuseaux horaires ou des opérateurs de cloud tiers. L’identification de ces points de défaillance constitue la première étape, mais l’accélération des mutations la rendra plus difficile.

Les entreprises ont besoin de moyens plus efficaces pour identifier les problèmes ou anticiper les défaillances avant que leur activité ne diminue ou que leur taux de fidélisation ne s’érode.

Dans ce contexte, les anciennes méthodes doivent être abandonnées. Comment les services informatiques peuvent-ils y faire face et réussir dans cet environnement complexe ? Voici les 4 étapes à suivre pour une meilleure politique interne de gestion de problèmes.

  1. Rester à jour sur les innovations – Les entreprises ne cessent de faire évoluer leur environnement de production ou d’étoffer leurs offres de services numériques et pour nombre d’entre elles, cela se traduit par une complexité accrue et des exigences supplémentaires envers le service informatique. Les équipes disposent souvent de plusieurs outils de surveillance qui sont cloisonnés et ne fournissent pas de vue générale des performances. Ces derniers montrent généralement le résultat des faibles performances plutôt que la cause première et lorsqu’un incident se produit, il est difficile (voire impossible) de comprendre les failles et donc de réagir en temps réel pour maintenir les performances. Pour détecter et traiter les incidents avant qu’ils n’aient un impact sur les clients, le service informatique doit avoir une visibilité globale et en temps réel de l’activité, et doit disposer de données exhaustives.
  1. Définir ce qu’est un « problème » – Les entreprises doivent réfléchir à ce qui est important pour leur activité. Dans le secteur de l’énergie, les conséquences d’une panne sont, au minimum, extrêmement préjudiciables et coûteuses et, au pire, potentiellement dangereuses. Dans le secteur du e-commerce, les longs temps de chargement peuvent avoir un impact dévastateur sur les revenus durant les fortes périodes comme les soldes, la rentrée ou les fêtes de fin d’année. Pour chaque activité, les indicateurs, les périodes et les problèmes doivent composer ce que nous appelons un « code rouge ». Il est essentiel de comprendre exactement ce qu’ils sont, quand ils surviennent et quelle forme ils revêtent pour faciliter la résolution de problèmes. Dans ce domaine, l’IT joue un rôle de majeur et doit être capable de s’exprimer sur les performances et transactions commerciales, et non sur la vitesse des processeurs. Un système capable de comprendre et de corréler des informations sur le parcours des utilisateurs et autour de certains indicateurs d’activité lui simplifie considérablement la tâche.
  1. Déterminer le rythme – Les entreprises doivent comprendre ce que sont leurs performances de base afin de définir ensuite ce qu’est un problème de performance. La définition de seuils de performances acceptables permettra aux équipes de repérer immédiatement les anomalies et de recevoir une alerte en temps réel en cas de problème critique pour l’activité. Toutefois, la charge peut considérablement changer d’une minute ou d’un jour à l’autre. Une application de livraison de repas peut enregistrer un trafic plus important les vendredis soir et une application de paie connaîtra un pic en début et fin de mois. Le système de surveillance des performances doit alors comprendre que cette charge ne signifie pas que le ciel est en train de tomber sur la tête de l’entreprise.
  1. Ne pas se contenter pas de corriger – Le rôle du service informatique a toujours été de résoudre les problèmes. Bien que la détection et la résolution soient cruciales pour le succès de l’entreprise, les informations détaillées auxquelles le service informatique a maintenant accès lui permettent d’aller beaucoup plus loin. Aujourd’hui, les équipes informatiques ont pour mission d’innover – cela passe par la création et l’amélioration de l’expérience utilisateur qui contribue au développement de l’activité. Réduire le temps passé à résoudre des problèmes leur permet de consacrer une plus grande partie de leur temps à développer de nouvelles solutions. En passant moins de temps à résoudre les problèmes, le service informatique peut consacrer une plus grande partie de son temps précieux à développer de nouvelles solutions axées sur la production. Fort de ses informations sur l’expérience client et de sa connaissance des problèmes existants, le service informatique peut (et doit) devenir un partenaire de la transformation en traçant les grandes lignes de l’activité future.

À l’heure où les entreprises évoluent vers des architectures applicatives davantage basées sur les services, où de plus en plus d’objets connectés fournissent des données, où de plus en plus de services migrent vers le cloud et où les systèmes automatisent les décisions, l’identification et la résolution des problèmes deviennent de plus en plus complexes. Les humains seront bientôt tout simplement incapables de gérer les énormes volumes de données et les multiples combinaisons de points de défaillance potentiels. La possibilité de voir les performances des applications, de visualiser votre architecture et vos dépendances à mesure que vous évoluez, et d’identifier les problèmes ayant un impact sur l’activité en temps réel est la seule façon d’accélérer la résolution. C’est également la seule façon de trouver les problèmes non résolus qui deviendront votre future activité.

___________
Erwan Paccard est Directeur Product Marketing d’AppDynamics