Pour permettre aux entreprises de mieux exploiter leurs données, la start-up française mise abondamment sur le Machine Learning et l’automatisation pour proposer un data catalog nécessitant très peu d’intervention humaine. De l’exploration à la classification sans oublier la fiabilité…tout est automatisé.

Dans un monde où savoir exploiter ses données est plus jamais synonyme d’avantage concurrentiel, l’heure n’est plus à la cartographie manuelle pour identifier les gisements existants dans l’entreprise avant de pouvoir les exploiter. D’autant que les sources de données ne cessent de se multiplier et que l’information évolue en permanence : le temps d’effectuer une cartographie, elle est déjà obsolète.

Dans une chaine data qui embarque toujours plus d’automatisation et d’intelligence, cette identification des actifs de données a longtemps été le point d’achoppement, les utilisateurs passant plus de temps à chercher des données qu’à les utiliser. L’essor des Data Catalogues pourrait mettre fin à cette problématique, surtout quand ils sont dopés au Machine Learning et à l’automatisation à outrance. Et c’est précisément l’objectif que s’est fixé la jeune start-up française Zeenea avec son concept de « smart data catalog ».

Une vision inspirée du fonctionnement des marketplace

« Notre vision du data catalog est très inspirée du fonctionnement des marketplace, explique Guillaume Bodet, CEO de Zeenea. Ce n’est pas supportable pour le consommateur d’arriver sur un site d’e-commerce où les photos seraient fausses, les descriptions incorrectes ou les prix erronés. Autrement dit, il est impossible de construire de la confiance sans catalogue fiable et pour ce faire, les marketplaces injectent dans leur plateforme un maximum d’automatisation et d’algorithmes pour aller détecter les éventuels problèmes ou erreurs et les corriger. Manuellement, c’est ingérable. C’est précisément l’approche que nous avons retenue pour notre data catalog. L’enjeu sur la construction de la confiance est énorme et nous sommes persuadés qu’il existe aujourd’hui des technologies d’innovation pour parvenir à un catalogue à la fois fiable, simple d’accès avec des circuits courts d’apprentissage et capables de prendre en compte la volumétrie exponentielle des entreprises ».

Zeenea s’inspire également de l’approche Google pour réaliser une indexation à plat des informations présentes dans l’entreprise avant d’essayer de les relier entre elles. « Autrement dit, on oublie les grands projets de classification à la Yahoo, on mise tout sur la technologie pour retrouver rapidement l’information et l’enrichir d’éléments de contextualisation métier nécessaires à son exploitation », explique le CEO de la société.  Pour ce faire, Zeenea utilise abondamment des algorithmes de Machine Learning pour taguer les données (personnelles, Solvency II, sensibles, etc.), estimer leur degré de fiabilité ou encore les relier à des concepts métier.

Une interface adaptative

Enfin, cette jeune start-up met également l’accent sur la nécessité de proposer une interface qui s’adapte à l’entreprise et pas l’inverse. « Le data catalog est là pour démocratiser l’usage de la donnée et sa compréhension. Il faut un outil qui soit simple d’accès avec une courbe d’apprentissage réduite », stipule Guillaume Bodet. Pour y parvenir, Zeenea a placé le moteur de recherche au centre de son smart data catalog. En appui sur les graphes connaissance pour compiler les résultats, elle facilite une meilleure compréhension par les utilisateurs du lien entre les différents actifs du data catalog. Au passage, ce design permet aussi à l’interface d’évoluer au rythme des besoins de l’entreprise, l’ajout de nouvelles sources ou de nouveaux cas d’utilisation étant automatiquement gérés par le data catalog.