Durant sa dernière mission à bord de l’ISS, l’astronaute Thomas Pesquet a rappelé l’importance des données et de leur enrichissement pour fournir des études et rapports précis. Le domaine de la science des données connaît une progression fulgurante depuis quelques années : de l’analyse financière à la prévention des risques climatiques, dans la plupart des entreprises, les dirigeants prennent conscience de son importance. Ils reconnaissent l’utilité cruciale de l’exploitation des données internes et externes appuyées sur des analyses avancées.

Les données occupent une fonction centrale dans toute activité, de la livraison de colis jusqu’à l’élaboration d’une trajectoire pour une mission spatiale et définissent la structure des activités. Les dirigeants d’entreprise prennent de plus en plus conscience que le machine learning et l’intelligence artificielle (IA) constitueront des sources d’avantages concurrentiels significatives dans les années à venir. Pour beaucoup, la difficulté consiste à déterminer par où commencer.

Comprendre l’enrichissement des données

L’enrichissement des données peut se définir comme le processus consistant à combiner les données de l’entreprise avec des données diverses provenant d’autres systèmes ou de sources de données tierces. Le but à terme de l’enrichissement de données est de fournir des informations qualitatives, complètes et exhaustives.

Un exemple caractéristique est celui d’une entreprise qui cherche à mieux cerner ses clients. En combinant les données dont elle dispose au sujet de ses clients avec des données démographiques externes et des informations comportementales, l’entreprise peut acquérir une compréhension beaucoup plus riche et nuancée de sa clientèle. En effet, l’enrichissement des données augmente la portée et la valeur de vos données d’entreprise existantes en les associant à des données de haute qualité issues de sources tierces.

Vers le futur de l’analyse des données

De nombreuses entreprises ont commencé à collecter leurs données et à en garantir le stockage à un endroit où elles pourront être utilisées à l’avenir. Il s’agit souvent de données textuelles, de données semi-structurées et non structurées, notamment des tickets de service, des avis d’utilisateurs et des messages sur les médias sociaux, ainsi que de sources plus traditionnelles comme les données transactionnelles ERP. En rassemblant et en organisant ces informations tout en veillant à ce qu’elles soient conservées de manière à pouvoir être utilisées ultérieurement, ces entreprises posent les bases qui leur permettront de tirer des avantages futurs de l’analyse des données.

De plus, l’enrichissement des données rend possible une cartographie efficace des paysages d’action d’une entreprise. Il offre en effet de précieuses informations pour les entreprises et qui, à leur tour, peuvent générer une intelligence immédiate.

C’est pour cette raison que certaines entreprises exploitent d’ores et déjà des données externes. Elles sont tout aussi nombreuses à envisager de commencer à utiliser des données externes dans le courant de l’année prochaine. Les tendances qui entourent les données géospatiales suivent un schéma similaire. Environ un tiers des entreprises utilisent les données de localisation d’une manière ou d’une autre, et les entreprises restantes ont l’intention de commencer à utiliser les données géospatiales au cours de l’année prochaine.

Ainsi, ces tendances reflètent le fait que les entreprises qui cherchent à comprendre et faire usage de leurs informations sont de plus en plus conscientes que l’enrichissement des données constitue un point de départ logique. Il s’agit ici de définir la manière dont les entreprises peuvent commencer à exploiter plus efficacement la science des données afin d’offrir, à terme, une activité plus adaptée.

Le rôle unique des données géospatiales

Les données géoréférencées offrent de leur côté une occasion particulièrement intéressante de créer de la valeur. Elles permettent d’accéder à des informations sur la position d’une entité particulière dans le temps et dans l’espace, notamment ses caractéristiques physiques, ce qui se trouve à sa proximité, le type de trafic ou même les conditions météorologiques à un moment donné. Les données géospatiales permettent de gérer des ensembles d’informations similaires pour les différents pays et régions du monde entier.  Lorsque combinées aux données d’entreprise existantes d’une organisation, elles fournissent un contenu particulièrement riche et des informations précieuses.

Or, les données géospatiales posent tout de même des difficultés particulières, car elles échappent à des formes et définitions standard qui caractérisent habituellement les données structurées. Les difficultés rencontrées dans l’utilisation de données géospatiales peuvent être comparées à des informations enregistrées dans une feuille de calcul, dans laquelle on essaierait d’y faire figurer des lignes sinueuses.

Dans le cas d’une adresse par exemple, le recours à l’intelligence de localisation consiste à calculer les distances, le temps de conduite moyen, ou la susceptibilité à certains types de phénomènes météorologiques extrêmes ou d’autres catastrophes naturelles. Ce type d’analyse, ainsi que de nombreux autres exemples dans le domaine de l’intelligence de localisation, nécessite des outils et des capacités spécialisés. Néanmoins, l’intelligence de localisation a le potentiel de générer une valeur intellectuelle importante.

L’enrichissement des données : un effort collectif

Afin de générer un intérêt palpable pour la collecte et la valorisation des informations, il est important de réaliser les différents intérêts de l’enrichissement des données. Pour ce faire, il convient généralement d’interroger plusieurs parties prenantes afin de déterminer les objectifs jugés les plus importants. Ces informations doivent être recoupées avec les données de l’organisation pour identifier les possibilités à forte valeur ajoutée.

Ainsi, l’entreprise aura peut-être identifié des objectifs déterminants en vue d’une analyse avancée, mais si l’ensemble des données nécessaires à cette analyse fait l’objet de sérieuses réserves, l’entreprise devra d’abord s’attaquer aux problèmes de qualité ou de gouvernance des données. Dans tous les cas, le processus doit faire appel à un éventail diversifié de compétences, des scientifiques des données aux utilisateurs professionnels, en passant par les décideurs stratégiques. La science des données est en effet un sport d’équipe.

En somme, les entreprises bénéficient aujourd’hui d’une gamme complète de fonctionnalités qui les aident à gérer et à intégrer leurs données, à maintenir une qualité élevée des données tout en enrichissant ces informations avec des données externes sélectionnées et à révéler le contexte à l’aide de données géospatiales.  En définitive, l’intégration, la qualité des données, l’enrichissement et l’intelligence de localisation, procure de la valeur, et lorsqu’ils sont combinés, constituent une plateforme d’intégrité des données qui procure un avantage considérable dans la connaissance de son entreprise, ses objectifs et ses clients.
___________________

Par Steve van den Berg, Vice-Président SEMEA chez Precisely

À lire également :

> Démocratiser la data science et rendre l’IA explicable et transparente
> Data Science & ML : les petits « Poucet » s’imposent face aux mastodontes
> Construire une gouvernance solide pour optimiser ses data
> Construire une stratégie data, un chemin ardu