Teradata propose à ses clients un service d’identification des sources et de suivi de l’utilisation des données qu’ils manipulent, leur permettant ainsi de savoir d’où elles proviennent et par quels traitements elles passent tout au long de leur cycle d’exploitation.
DataDNA est un service en mode SaaS d’investigation des données. Il offre une vision transparente des données et de leur utilisation sur tout l’écosystème analytique, quelle que soit de la plateforme ou la technologie utilisée. Il apporte une compréhension complète des données – quelle que soit la façon dont elles sont consommées ou traitées, par qui et comment. Dès lors, il permet aux entreprises d’éliminer les redondances, d’accélérer les chaînes d’intégration, d’encourager la qualité des données avant la quantité et au final de réduire les coûts de la data.
En fournissant automatiquement une vision multi-plateforme du lignage de données (de la source à la consommation, en passant par les traitements de transformations), DataDNA permet :
- La simplification des écosystèmes IT et la réduction de coûts associés
- L’élimination de la duplication des données
- La production d’analyses métier en libre-service
- L’assurance d’une gouvernance des données efficace et basée sur la réalité de ce qui est en place
- La garantie de la qualité des données
- La réconciliation des processus et des données sur différentes plateformes
- L’analyse automatisée et juste de l’impact des changements.
Les fonctionnalités de DataDNA comprennent :
- Le lignage automatisé des données : qui permet de comprendre la manière dont l’information circule dans une entreprise, au niveau le plus fin, en s’appuyant sur les faits.
- L’analyse automatisée de l’utilisation des données : qui permet de comprendre qui utilise les informations, à quel moment et de quelle manière. Cela permet de faciliter les opérations de nettoyage, de déclassement, d’analyse des données personnelles d’identification (PII) et la mise en conformité vis-à-vis des différentes réglementations, telles que le RGDP.
- Le catalogue de données : qui permet de déterminer quelles informations représentent un atout pour une entreprise, ainsi que les personnes qui les utilisent – afin de les monétiser, de créer des données as-a-service, etc.
- La gestion de dictionnaires métier : qui permet aux entreprises de concevoir et de gérer des dictionnaires en établissant un lien entre les termes métier et l’origine physique des données.
- La prise d’empreinte des domaines de données : qui permet de comprendre quels domaines de données sont utilisés par les environnements IT et de favoriser les cas d’utilisation de migration dans le cloud, l’analyse de la duplication et bien d’autres fonctionnalités.
- Le repérage des PII : qui permet de définir où les données sont stockées et la manière dont elles circulent au sein d’un environnement grâce aux métadonnées. Cette approche par touches légères réduit considérablement la quantité de ressources système et humaines nécessaires pour déterminer l’endroit où les PII sont conservées et qui y accède.
- L’analyse d’impact : qui permet, en cliquant sur un bouton, de créer un rapport d’analyse d’impact pour déterminer l’effet qu’un changement aura sur l’ensemble des systèmes connectés.
La gouvernance de la donnée est un sujet phare dans un monde d’entreprises toujours plus centrées autour de la Data. Pour Niels Brandt, VP Customer Success & Consulting chez Teradata, « en automatisant une partie de la gouvernance de données, nos clients vont réduire le temps passé à des tâches répétitives à faible impact, leur permettant ainsi de dédier davantage de leur temps à une meilleure collaboration, à la formation et à des services à forte création de valeur ».