Le big data, qui suscite un intérêt grandissant, (Le big data s’invite dans les entreprises) peut être présenté en 5 grands modules d’architecture fonctionnelle :

1. Collecte : ce module vise à  récupérer les données à transmettre aux unités de transformation et d’analyse. La collecte peut se faire par lot ou en temps réel sur des données internes ou externes à l’entreprise.

2. Transformation : il s’agit ici d’extraire les informations utiles des données peu ou non structurées. En les interprétant pour les rendre exploitables et cohérentes, notamment via la constitution d’un catalogue de métadonnées. Cette étape n’est pas obligatoire pour les données déjà structurées.

3. Analyse : alors que la « transformation » se focalise sur l’enrichissement des données de manière unitaire, l’unité d’analyse va de son côté créer de nouvelles informations par identification, corrélation, agrégation ou projection de l’ensemble des données précédemment transformées. Tout comme pour la « collecte », ces analyses peuvent être effectuées par lot ou en temps réel.

4. Restitution : l’objectif de ce module est de permettre la visualisation des analyses et l’exploration des données.

5. Stockage : capable de stocker de très gros volumes de données structurées et non structurées.

 

Pour lire l’article de Jonas Cadillon, Consultant du cabinet Solucom