Le big data est sur toutes les lèvres. Cette dernière vague technologique est censée – selon les fournisseurs – censé résoudre tous les problèmes et être la panacée. Mais les données ne sont pas sans poser de questions.

« Big data, big opportunities », le message ambiant relayé par les directions marketing des fournisseurs spécialisés est simple. Peut-être un peu trop simple et n’est pas sans quelques idées reçus qu’à tenu à débusquer le Garner. Le big data est sous les feux de l’actualité. Selon l’analyse du Gartner selon le prisme du fameux hype cycle en 5 étapes de développement, le big data serait au point culminant du cycle. C’est la phase d’adoption par les passionnés, suscitant des attentes parfois exagérées (Peak of Inflated Expectations). De fait, l’intérêt pour le big data est au plus haut et selon une enquête récente réalisée par le Gartner, 73 % des entreprises déclarent avoir investi ou prévoit de le faire dans ces applications. Mais, revers de la médaille, la plupart d’entre elles (13 %) seulement ont déployé des projets en production. Parmi les défis auxquelles sont confrontées les entreprises est de savoir comment dégager de la valeur en exploitant les données disponibles et surtout, dit de manière un peu triviale, par quel bout commencer. De nombreuses entreprises n’arrivent pas à dépasser le stade du pilote parce qu’elles « ne relient pas les technologies aux processus et à des cas concrets ».

27 Big data1

27 Big data2

 

Dans big data, il y a le qualificatif big exprime bien l’idée que le volume est considérable et en augmentation exponentielle. D’ailleurs, il s’inscrit bien dans les 3V (Volume, Variété, Vélocité) auquel on peut ajouter le quatrième V, la véracité. Se pose alors le problème de la qualité des données. Une idée simple voudrait que si la qualité de certaines données n’est pas satisfaisante, ce n’est pas très grave dans la mesure où on le met en regard du volume des données à traiter. Ted Friedman, consultant du Gartner pense au contraire que ce problème de qualité se pose avec autant d’acuité d’autant que de nombreuses d’entre elles viennent de l’extérieur ou sont de structures ou d’origines inconnues.

Avec le big data et les données structurées et non structurées, il existe un mythe selon lequel il suffirait de technologies de « lecture à la volée » de ces données pour les interpréter. Mais pour une quelconque exploitation, on ne pourra pas faire l’économie de l’utilisation des technologies d’intégration des données, les fameux ETL (Extract, Transform, Load) que l’on connaissait avec la génération précédente de la BI. D’ailleurs sur ce point d’utilisation des technologies déjà existantes, le Gartner est assez clair. Les data warehouses traditionnels ont toujours leur rôle à jouer. Les data managers doivent faire le tri entre les données exploitables et les autres, les agréger.

Inquiétudes face à la donnée

Si les big data posent des défis aux entreprises, elles ne sont pas sans susciter des inquiétudes chez les particuliers. C’est que révèle une étude réalisée par Havas Media Group France dans le cadre de son approche DDOG [Data Driven Organic Growth qui dresse un état des lieux sur le rapport des Français à la donnée. Principal enseignement, après des réactions d’inquiétude, les comportements évoluent et ouvrent des perspectives. Si une grande majorité des Français est conscient de la captation de ses données personnelles et s’en déclarent inquiets, près d’un français sur deux déclare pouvoir y trouver un intérêt, mais à certaines conditions.

Parmi les principaux enseignements de l’étude Havas Media :

– La captation des données, phénomène de société : 93% des internautes 15-64 ans sont conscients de la captation de leurs données personnelles, et 84% se déclarent inquiets de l’usage qui peut en être fait.

– Un phénomène qui engendre de profondes craintes : 74% des internautes sont inquiets de l’usage frauduleux qui pourrait être fait de leurs données, 53% que leur intimité puisse être révélée, et 47% qu’elles puissent être utilisées dans un cadre de surveillance et de sécurité, hors de tout contrôle et de toute transparence.

– En toute logique, les internautes mettent en place des mesures de protection, de la simple création de pseudonymes sur la toile (45%) à la mise en place d’outils et de protocoles spécifiques pour limiter la récupération de leurs données (29%). Mais pour un Français sur deux (46% des interviewés), la captation de leurs data peut être une source d’opportunités, en bénéficiant notamment d’offres personnalisées.

Enfin, une majorité d’internautes seraient prêts à accepter le suivi de leurs données digitales en toute transparence moyennant des contre parties : 45% ouverts à une contrepartie financière et 42% ouverts à des contreparties non financières.