Dans les entreprises, les outils décisionnels se limitent souvent à des rapports PDF ou autres fichiers Excel. S’ils permettent une vue d’ensemble de l’activité, ils trouvent rapidement leurs limites lorsqu’il s’agit de rentrer dans des analyses plus fines. Afin d’en améliorer la performance et obtenir une vue transversale de l’activité, il est alors possible de se tourner vers les cubes OLAP.
L’utilisateur va pouvoir choisir d’observer le ou les indicateurs au croisement des dimensions choisies. Les données de l’activité de l’entreprise sont donc enfin accessibles et manipulables selon toutes les combinaisons de dimensions possibles… en toute liberté.
Pourquoi OLAP (Online analytical processing) ?
Du point de vue de l’utilisateur, un cube OLAP peut être vulgarisé comme un tableau croisé dynamique plus performant car il permet de naviguer au sein d’une base de données volumineuse presque instantanément.
En donnant accès à un ensemble « coordonné » de données aux utilisateurs, les utilisateurs sont indépendants de la DSI. On évite ainsi l’intervention d’un développeur pour concevoir un nouvel état.
On peut imaginer par exemple aller d’un tableau par année au même tableau présentant le même indicateur mais détaillé sur les mois.
Qu’est-ce qu’un cube OLAP ?
Un cube OLAP est, avant toute chose, une base de données multidimensionnelle, dans laquelle les données sont pré-calculées. L’utilisateur peut ainsi en interroger un volume important sans impacter le temps de réponse qui est, la plupart du temps, instantané.
Le cube apporte aussi une possibilité de « Data Digging ». L’utilisateur a la possibilité de voir, donc de comprendre, les composantes d’un agrégat. L’agrégation fournie par l’OLAP ne détruit rien ce qui permet à l’utilisateur de remonter jusqu’à la source de l’information.
Comment s’utilise un cube OLAP ?
Il peut être consulté directement dans Excel, comme un tableau croisé dynamique standard. Il peut également être consulté et manipulé directement dans des pages web, en HTML, grâce à certains composants.
A quelles problématiques techniques les cubes OLAP permettent-ils de répondre ?
Le premier frein à l’analyse est, très souvent, le volume. Quand on doit analyser les opérations de 350 points de vente, ou les transports de milliers de colis par exemple, les données s’accumulent rapidement. Les agréger manuellement prend beaucoup de temps et c’est une importante source d’erreur.
« Je compile/consolide mes données avec Excel et là, on n’y arrive plus. C’est trop long, on a trop de paramètres de reporting, on a trop de fichiers. On a une perte de l’information. »
Il n’est pas rare d’entendre cette citation de la part des entreprises. Là où une base de données traditionnelle de type SQL, MySql ou Oracle imposeraient des temps de réponse de l’ordre des minutes ou même des heures, OLAP répondra quasi instantanément.
Une autre facette non négligeable apportée par OLAP est la sécurité. Basé sur les comptes Windows, l’accès aux données est contrôlé jusqu’à la maille la plus fine : la cellule. Les données étant actualisées régulièrement, l’utilisateur ne sera pas confronté à des données obsolètes, ni à des données en dehors de son périmètre.
Dans quel cas métiers ces cubes apportent-ils un gain important ?
Tous les domaines qui brassent un important volume de données peuvent tirer parti de l’utilisation des cubes OLAP. On peut notamment citer les banques, dans le contrôle de gestion. Des millions de lignes provenant des agences alimentent les cubes chaque mois. Les cubes OLAP permettent d’assurer le reporting mensuel interne et légal à J +4. Les contrôleurs de gestion peuvent ainsi se concentrer sur leur métier d’analyse et non sur la consolidation des données.
Le domaine de l’énergie est également concerné. Dans un grand groupe, lors d’un audit multi-filiales qui comprend des millions de lignes, il est possible d’interroger rapidement des éléments de dizaines de filiales du groupe (Achat / Vente, Transport, Rentabilité).
Techniquement y-a-t-il des contraintes d’utilisation de ces cubes ?
L’accès aux cubes OLAP est extrêmement simple puisqu’ils peuvent être consultés via un protocole http, même dans Excel.
Il faut, par la suite, installer les composantes Analysis Services de SQL Server. Cela peut prendre n’importe quelle source de donnée en entrée (base Oracle, base MySQL, Base SQL Server, Source ODBC…)
Il faut toutefois noter que l’on est dépendant du système d’authentification de Windows (compte locaux ou active directory). Par conséquent, il n’est pas possible d’aller dans un autre environnement. De la même manière, si l’on obtient un rendu sous Excel lorsque l’on interroge une base de données, une fois déconnecté, il n’est plus possible d’explorer les détails.
___________
Michael Duval est Expert en Business Intelligence chez FWA