La pandémie a forcé les entreprises du monde entier à prendre des décisions à un rythme effréné, chacune d’entre elles ayant une incidence sur leur développement et leur réussite. Avec le variant Delta en pleine expansion, les entreprises doivent anticiper différents scénarios, contribuant à accroître la diversité, la rapidité et le volume de leurs données. La migration vers le cloud connaît une accélération considérable car les entreprises doivent partager tous types de données à distance. La pression croissante en faveur de la transformation digitale a remis en question les capacités technologiques existantes, contribuant à l’émergence d’un “cloud Covid”. Dans le déluge des données disponibles, les difficultés d’accès, d’organisation et de tri exacerbent la situation, entraînant de nouveaux défis en matière d’utilisation des données pour guider les décisions stratégiques et les résultats business de l’entreprise.

Passer au crible les dark data 

Depuis des décennies, la gestion des données s’est concentrée sur la mécanique suivante : collecte, traitement et stockage. Mais il ne s’agit pas du cœur du problème. La difficulté majeure ne réside pas dans le fait de disposer ou non de données, mais de les utiliser dans un but précis. Une quantité considérable de données sont inutilisées ou non exploitées, tant et si bien que la plupart des entreprises se retrouvent dans un environnement numérique de “dark data”, toxiques et désordonnées. Ces entreprises n’ont pas d’idée précise du type de données dont elles disposent, ni de leur emplacement, voire de leur existence.

Négliger ces “dark data” entraîne une multitude de problèmes. Outre le désavantage concurrentiel lié à la non-utilisation de données potentiellement précieuses pour l’entreprise et leur coût élevé de stockage, il existe un risque accru de brèches de sécurité et de violations importantes de la vie privée, ainsi qu’une atteinte à la réputation de l’entreprise qui en découle. Cela peut sembler insurmontable, mais des solutions existent pour sortir ces données de l’ombre et identifier de nouveaux potentiels.

Sortir la tête du cloud

Les préoccupations portant sur la mécanique de gestion des données posent d’énormes défis. La plupart des entreprises déploient une approche fragmentée de la gestion, de l’intégration et du stockage des données, créant ainsi des silos. C’est non seulement coûteux et difficile à gérer, mais cela contribue aussi à « assombrir » les données, rendant leur analyse impossible. La question de la validation rapide par les collaborateurs et systèmes situés en première ligne ne se pose pas si les données qui alimentent les décisions business quotidiennes sont fiables, conformes et accessibles rapidement.

Dans la plupart des cas, les solutions et plateformes de migration, de collecte, de préparation et de stockage n’aident pas les entreprises à mieux comprendre les données dont elles disposent, ni à obtenir de meilleurs résultats. Lorsque l’on déplace des données et même lorsqu’on les stocke sans tenir compte de leur qualité ou de leur santé, on crée une décharge numérique d’informations. Au lieu de résoudre les problèmes des clients et de l’entreprise, on complique encore le tri au sein de ce chaos de données.

Certaines sociétés de gestion de données semblent penser que le fait de stocker toujours plus de données ou de les migrer vers le cloud aide les entreprises à surmonter ces défis fondamentaux. Alors que les gains d’efficacité et les nouvelles plateformes d’analytique dans le cloud aident les organisations à se réinventer et être toujours plus axées sur les données, de plus en plus d’entreprises réalisent qu’une approche parcellaire de la gestion des données – même dans le cloud – n’est pas suffisante. Il ne suffit pas de collecter, déplacer et préparer les données plus efficacement dans le cloud. Se concentrer sur l’intégrité des données est essentiel dans un environnement toujours plus axé sur le cloud.

Définir et maintenir des données saines et de qualité

Les données business proviennent de sources internes ou tierces. Elles sont souvent collectées par le biais de saisies manuelles, ce qui est propice aux erreurs et rend leur gestion difficile. En outre, lorsqu’elles sont extraites de leur environnement initial, les données perdent leur contexte d’origine et cessent de faire partie des habitudes, solutions et bonnes pratiques de leurs utilisateurs réguliers, un élément qui reste souvent ignoré. Cela entraîne inévitablement des problèmes lorsque de nouvelles finalités leur sont appliquées (par exemple, de l’analytique) car ces données peuvent être de mauvaise qualité (inexactes, obsolètes, incomplètes, etc.) ou, pire encore, leur accès peut s’avérer non autorisé (données personnelles).

Il y a des similitudes entre la santé physique et la santé des données. Prendre soin de sa santé tout au long de sa vie exige de la discipline, une certaine logistique et un équipement adéquat. Tout comme les professionnels de santé sont essentiels à un système de santé de qualité, les professionnels des données (et leurs utilisateurs) font partie intégrante d’un système de santé des données performant. La santé des données concerne chaque collaborateur, d’où l’importance d’une approche généralisée.

Un bon système de santé des données doit s’appuyer sur plusieurs éléments importants : l’identification des facteurs de risque, pour prévenir les problèmes de sécurité, des programmes de prévention qui normalisent les données pour en faciliter la digestion, l' »inoculation » proactive utilisant les technologies de machine learning pour former les systèmes à reconnaître les données de qualité insuffisante, la surveillance continue pour un diagnostic rapide des données et des évaluations correctes, des protocoles pour une pronostic persistant qui améliore la qualité des données, et des traitements efficaces qui permettent d’équilibrer les risques et les avantages qui en découlent.

L’adage « Mieux vaut prévenir que guérir » est toujours d’actualité. La mise en place de la santé des données est un nouveau muscle professionnel qui nécessite beaucoup de travail et implique de nouvelles façons de penser. Instaurer une culture d’amélioration continue, soutenue par des collaborateurs équipés des meilleurs outils permettant de garantir l’intégrité, l’intégration, la gouvernance et l’accessibilité des données, permet de protéger l’entreprise des risques les plus importants et les plus coûteux, tout en optimisant la valeur de ces données.

C’est pourquoi il est important d’investir dès maintenant dans la santé des données pour naviguer avec sérénité au sein d’un “cloud Covid” et disposer d’informations exploitables et disponibles en temps voulu.
___________________

Par Krishna Tammana, CTO de Talend