Les attentes que beaucoup d’entreprises formulent à propos du big data reposent notamment sur une hypothèse : que les données sont de qualité.
Bad data est un « mal de société » n’hésite pas à affirmer le cabinet de conseil The Robert Francis Group à l’occasion de la publication des résultats d’une enquête intitulée « Poor Data Quality – Negative Business Outcomes ». Les en sont multiples explique l’auteur de cette enquête :
– Les directions des entreprises ne financent pas suffisamment des projets de gouvernance des données ;
– Les responsables informatiques n’arrivent pas à faire comprendre à leurs collègues de l’importance de la qualité des données ;
– Les partenaires qui gravitent dans l’écosystème d’une entreprise ne réagissent pas lorsque des données de mauvaises qualité sont échangées ;
– Les analystes financiers ne dégradant pas les entreprises qui publient des rapports financiers de mauvaise qualité ;
– Les clients ne se détournent pas des entreprises qui commettent des erreurs suite à l’utilisation de données de mauvaise qualité.
Et cette liste n’est pas complète. Concernant les données elles-mêmes, les trois principaux types de défaut sont, selon les personnes interrogées, qu’elles sont imprécises, définies de manière ambigüe, et non fiables. Parmi les autres problèmes, on peut mentionner la désorganisation des données, le fait qu’elles n’existent pas et les difficultés à les récupérer.
– Selon cette enquête, 95 % des personnes impliquées dans le fonctionnement d’une supply chain font part de réduction de financement permettant une intégration satisfaisante ;
– 72 % font état de problèmes de données clients et 71 % indiquent avoir perdu des affaires par manque de connaissance clients ;
– 71 % des personnes qui mentionnent des problèmes de reporting financier indiquent que des données de mauvaise qualité les poussent à formuler des conclusions erronées.
Cette enquête met l’accent sur la supply chain qui est définie « comme une communauté d’organisations consentantes qui font circuler des informations en leur sein pour faciliter la gestion d’activités comme les achats, les ventes, les stocks, les commandes…». Le Cigref pointe aussi le fait que la transformation numérique ne concerne pas seulement les entreprises, mais qu’elle touche tout l’écosystème[1] : « l’espace de production de valeur s’étend désormais aux parties prenantes de l’entreprise, aux espaces sociaux, à la mobilité et au temps personnel. L’interdépendance des entreprises avec leur écosystème (…) est une réalité que le numérique vient renforcer. » La transmission de mauvaises données peut donc avoir des conséquences dont la métaphore de l’effet papillon définie par Philip Meriless en 1972 donne une idée de la gravité : « un battement d’ailes de papillon au Brésil peut entraîner une tornade au Texas ».
Au-delà de la question de la qualité des données, d’autres difficultés sont couramment associées au big data. Il y a d’abord le manque de ce qu’on appelle Outre-Atlantique les data scientists. Ce manque est criant en France même si aucune évaluation des besoins n’en n’a été faite sachant que par ailleurs, le nombre de réels projets sur l’Hexagone reste faible. Le cabinet McKinsey évalue ce manque d’experts aux Etats-Unis entre 140 000 et 190 000. Par ailleurs, les outils du big data – Hive, Pig, Cassandra, MongoDB ou encore Hadoop – sont relativement nouveaux et ne bénéficient pas du support de la part des fournisseurs dont ils auraient besoin. Autre écueil, celui d’investir des moyens importants dans des projets pharaoniques mais mal définis en raison du manque de recul et d’expérience.
Le volume du stockage considérable des données posent encore plus de problèmes de protection de la vie privée. Les dernières fuites sur l’écoute de millions de communications de citoyens français par la NSA montrent bien les capacités d’analyse dont sont dotées certaines entreprises et les usages qu’elle serait tentées d’en faire pour bénéficier d’un avantage concurrentiel. « L’impact du big data sur le modèle économique des entreprises peut-être majeur car, celui-ci pourra être remis en cause, voire menacé par certains pure players qui, disposant de toutes les données, pourront investir des nouveaux métiers demain (Google, Amazon…) » avertit le Cigref dans son rapport. Indiscutablement, le big data est une composante de la transformation de l’entreprise, mais de l’économie tout entière.
(Source : Wall Street Journal)