L’adoption de l’Enterprise Feature Store (EFS) marque une révolution dans la gestion des données d’entreprise, permettant une réutilisation optimale des variables et une accélération du déploiement des modèles d’IA.

Les entreprises demeureront viables et compétitives à condition qu’elles sachent manipuler et utiliser l’intelligence artificielle (IA). Une étude du cabinet Mckinsey indique que, d’ici 2030, 70 % des entreprises auront recours à une forme d’IA au minima. Toutefois, c’est uniquement grâce à une plateforme de données de qualité et à des flux de travail optimisés sur l’ensemble du système que l’adoption de l’IA sera un succès pour les entreprises.

L’approche la plus plébiscitée par les entreprises consiste à intégrer les pipelines au cœur des projets analytiques, et est parfaitement adaptée pour les projets de tests, de recherche ou encore d’expérimentation. En effet, ces pipelines sont conçus de façon à traiter des problèmes lors de cas d’usage. Néanmoins, pour les projets de plus grandes envergures, cette approche entraîne la création de silos de données et rend les processus inefficaces.

Cela est généralement dû au travail des différentes équipes qui, en utilisant les mêmes données, créent des fonctionnalités quasi identiques, mais indépendantes les unes des autres. Celles-ci restent alors isolées dans leurs propres pipelines et l’ accumulation de ces derniers constitue en quelque sorte une « jungle ». En conséquence, les projets sont plus onéreux et plus longs dans le temps, entraînant de fait un ralentissement de leur commercialisation. La confiance portée par les équipes dans la valeur du Machine Learning (ML) est alors affectée.

La faculté des entreprises à rester compétitive et évolutive selon les futures exigences numériques est alors mise à mal lorsque cette approche pipeline est appliquée aux projets analytiques et IA. À l’avenir, seule la mise en place d’une approche dynamique permettra d’intégrer efficacement et durablement l’IA au cœur de l’organisation.

De l’IA à grande échelle grâce à l’Enterprise Feature Store (EFS)

Découpler les différents domaines de processus est la première étape pour obtenir plus de flexibilité et de dynamisme. Elle permet ensuite de se focaliser sur trois domaines essentiels du processus : l’ingénierie des « features », la formation des modèles et leur déploiement. En portant une attention plus poussée à la réutilisation des features et au déploiement du modèle, les entreprises connaîtront plus de succès dans la mise en œuvre de projets ML et IA.

Dans cette optique, l’Enterprise Feature Store devient la pierre angulaire du système. Il permet notamment de recueillir et d’organiser les variables avec une valeur prédictive prouvée. Schématisées sous forme de tableau, ces variables sont stockées au sein d’un système de gestion de base de données relationnelle analytique (SGBDR). Ainsi, les fonctionnalités sont plus facilement accessibles et peuvent être réutilisées dans le cadre de l’analyse prédictive ou pour la formation de modèles.

Certes, l’élaboration de ces features et leur classement nécessitent un temps conséquent pour les entreprises. Mais, une fois correctement déployées et documentées, leur réutilisation offre un gain de temps aux projets. L’EFS permet ainsi de réduire de 80% les efforts et les coûts de préparation et de gestion des données. De fait, il diminue également le délai de rentabilisation des nouvelles analyses exécutées et améliore la productivité des data scientists.

Entraînement et création des modèles IA au cœur de l’EFS

Pour toute stratégie d’IA menée par une entreprise, le développement de modèles d’IA robustes et précis est le second critère essentiel pour une mise en œuvre réussie. Toutefois, une condition doit être respectée : les dirigeants doivent donner aux data scientists la possibilité d’accéder et de fouiller librement les données et les algorithmes qui les régissent, avec les outils adéquats.

Dans le cadre de l’entraînement des modèles, il est primordial que les données utilisées soient réemployées et issues des variables de l’Enterprise Feature Store (EFS). De surcroît, la totalité des nouvelles features développées doit être ajoutée au sein de l’EFS pour être réutilisée à leur tour. Le choix de cette approche répétitive pour la génération de modèles d’IA rend indissociables les étapes de découverte et d’évaluation des données. Lorsque le modèle est conçu et testé, il faut impérativement déplacer le code qui sous-tend ces features dans l’EFS. De cette manière, il n’est plus associé à un modèle propre et reste accessible pour d’autres utilisations. En pensant la réalisation des modèles comme une activité distincte, il est possible d’inclure de manière transparente les modèles créés à partir de systèmes externes au cœur de la plateforme de données ou plate-forme data elle-même.

Pour optimiser au maximum la création de valeur d’un projet analytique, s’appuyer sur des plateformes de données mises à jour en temps réel est essentiel. La sélection précise des échantillons de données historiques est le socle fondateur de l’entraînement des modèles d’IA. Malgré tout, l’accès à des ensembles de données à jour et complets reste fondamental pour effectuer une évaluation pertinente des modèles. Sous-estimée, la principale cause d’échec de certains projets d’analyse de données est la difficulté de passer de la phase d’entraînement du modèle à celle de l’évaluation.

La construction d’un modèle prédictif et son évaluation à grande échelle peuvent être réalisées grâce à l’adoption d’une approche Bring Your Own Mdel (BYOM). Les data scientists, libres de sélectionner l’outil qui le plus adapté, y parviennent en s’aidant directement des données de production contenues dans l’EFS. L’évaluation des modèles d’IA, entraînés sur des systèmes externes dans la plateforme de données en production, et leur déploiement à grande échelle deviennent ainsi possible grâce à une intégration étroite et à différentes méthodes telles que PMML ou ONNX, la conversion au format SQL ou le code natif.

Garantir un retour sur investissement maximal

La définition de processus simples et robustes est un élément majeur de l’analyse prédictive. L’EFS et les modèles entraînés rendent disponibles les éléments nécessaires à l’analyse au sein de la plateforme de données. Opérer des transferts de données vers ou depuis des systèmes externes n’est alors plus indispensable. Mais, pour cela, il est impératif que les systèmes soient directement connectés aux endpoints opérationnels par divers canaux et qu’ils prennent en charge les requêtes métiers pour pouvoir évaluer les modèles en quasi temps réel grâce à des temps de latence fortement réduits. La performance et l’évolutivité des workloads de notation sont également des éléments clés, sans quoi il sera impossible de concevoir, grâce à l’IA/ML, de nouvelles prédictions à partie des données de production à jour. Les entreprises obtiennent alors une réelle valeur ajoutée et un retour sur investissement satisfaisant grâce aux projections obtenues.

L’IA et le ML peuvent donc offrir de belles perspectives aux entreprises, à condition qu’elles ne s’enlisent pas dans les silos de données, les systèmes fragmentés et une trop importante duplication des tâches, qui pourraient entraîner des échecs dans le déploiement et des coûts trop importants. Il est donc primordial d’utiliser une plateforme de données évolutive et puissante, permettant la factorisation des données et l’exécution des modèles à l’échelle. En d’autres termes, la simplification de l’écosystème data favorise l’amplification de la démocratisation des usages analytiques.

Les entreprises mettent ainsi fin aux « jungles » de pipelines , à la dette des données qui s’en suit et aux audits interminables, et ont la quasi-certitude d’en retirer un retour sur investissement maximal.
____________________________

Par Jean-Marc Bonnet, Sales Technology Director, Teradata

 

À lire également :

Les enjeux clefs de l’IA générative

Entreprise autonome : faire appel à l’IA pour fluidifier les parcours…

Les grands chantiers des LLM et de l’IA générative

Rapidité, agilité et optimisation : les atouts de l’IA en entreprise