Hortonworks, IBM et Pivotal annonçaient le mois dernier (Hortonworks, IBM et Pivotal harmonisent leur version d’hadoop) que leurs solutions hadoop respectives sont désormais alignées sur le socle standard commun de l’Open Data Platform (ODP), reposant la version hadoop 2.6 (comprenant HDFS, YARN et MapReduce) et Apache Ambari. L’initiative ODP vise à simplifier l’adoption d’Apache hadoop par les entreprises et à encourager le développement de solutions d’analyse du Big Data grâce à une plus grande interopérabilité au sein de l’écosystème.

Xavier Guérin, Vice-Président EMEA du business development, partenariats & alliances chez MapR Technologies explique pourquoi son entreprise ne participera pas à cette initiative.

*    *
*

MapR a été invité à participer à l’initiative Open Data Platform (ODP), une offre que la société a refusée après avoir attentivement étudié la valeur qu’elle apporte au marché. Telle qu’elle a été annoncée, l’initiative Open Data Platform est une opération marketing réussie pour Hortonworks et une élégante porte de sortie pour Greenplum Pivotal. Si la charte de l’initiative Open Data Platform venait à être modifiée, MapR pourrait envisager une éventuelle participation. Mais pour l’instant, ses préoccupations sont les suivantes :

L’initiative ODP est redondante avec la gouvernance de la Fondation Apache

La Fondation Apache (Apache Software Foundation) a accompli un formidable travail en créant la plateforme Hadoop, véritable référence où les applications sont interopérables au sein des distributions Hadoop. La gouvernance Apache repose sur une méritocratie sans cotisations pour participer ou voter. Par son dynamisme, la communauté Apache a permis à Hadoop de conquérir une position omniprésente sur le marché en seulement quelques années.

Open Data Platform s’intéresse à des problèmes qui n’ont pas besoin d’être résolus

Les entreprises qui déploient des applications Hadoop n’ont pas de crainte à avoir de se retrouver pieds et poings liés avec leurs fournisseurs, ni de rencontrer de quelconques problèmes d’interopérabilité. Sur leur blog, Merv Adrian et Nick Heudecker, deux analystes du cabinet Gartner, ont récemment dévoilé que moins d’1 % des entreprises considèrent l’interopérabilité et la « captivité » vis à vis de fournisseurs comme des problèmes — ces deux sujets arrivant bons derniers sur la liste des préoccupations des clients. En effet, l’interopérabilité des projets et des sous-projets est excellente et garantie par des distributions aussi bien gratuites que payantes : les applications basées sur une distribution peuvent migrer vers une autre distribution moyennant un coût pratiquement nul.

Un « noyau » mal défini

La définition du « noyau » de la plateforme ODP varie selon les fournisseurs : MapReduce, YARN, Ambari et HDFS. MapReduce est abondamment utilisé, mais de nombreux gestionnaires de ressources et frameworks de calcul tels que YARN, Spark et Mesos gagnent des parts de marché. Ambari est utilisé par moins de 25 % du marché. La plateforme Hadoop a été architecturée pour prendre en charge les alternatives plug-and-play au système de fichiers distribué Hadoop HDFS — lequel a été créé pour servir de stockage secondaire aux opérations de traitement batch Hadoop. Dans de nombreux scénarios de production qui requièrent un environnement de stockage compatible POSIX, le système de fichiers distribué HDFS est remplacé par MapR, IBM GPFS, Isilon ou bien NetApp.

Une plateforme où sont absents les grands noms d’Hadoop

Près de 75 % des implémentations Hadoop tournent en environnement MapR et Cloudera, deux éditeurs qui ont décidé de ne pas participer à l’initiative ODP. Or, l’initiative Open Data Platform sans MapR ni Cloudera, c’est un peu comme si l’un des trois grands constructeurs automobiles œuvrait en faveur d’une standardisation sans l’appui des deux autres.

La plateforme Open Data ne peut être considérée comme une plateforme « ouverte » si des droits de vote identiques ne sont pas accordés aux principales distributions Hadoop. L’initiative ODP n’a pas indiqué comment la gouvernance serait mise en œuvre, mais quoi qu’il en soit, ce modèle diffère de la méritocratie juste et équitable que prône la fondation Apache.

– Quel est le montant des cotisations ?
– Comment les cotisations influencent les droits de vote ?
– Où vont les fonds ?
– Quel est le degré d’engagement des membres de l’initiative Open Data Platform ? Quel est le montant de leur cotisation ?
– Les membres ultérieurs paieront-ils la même cotisation et disposeront-ils des mêmes droits de vote ?

Nous nous engageons en faveur de la participation et de la coopération communautaire pour contribuer aux avancées de la technologie et générer de la valeur ajoutée pour les clients. Tant qu’il n’apparaît pas clairement que la structure, l’orientation et la participation de l’ODP peuvent répondre efficacement aux problématiques-clés actuelles des clients telles que la data gouvernance, la sécurité ou les applications temps réel, nous concentrerons nos efforts en faveur de la fondation Apache.