Hortonworks annonce plusieurs innovations au sein de son offre Hortonworks Data Platform (HDP). La nouvelle version HDP 2.5 fournit aux entreprises des composants clés en main, des fonctionnalités de sécurité et de gouvernance notamment, simplifie l’administration du data center et les opérations, et intègre les dernières avancées en matière de data science. Avec cette nouvelle version de son offre Extended Services, Hortonworks met à disposition des entreprises les innovations de la communauté Apache Hadoop.

HDP 2.5 intègre les processus de sécurité et de gouvernance des données les plus performants permettant de définir et d’appliquer des politiques de sécurité s’appuyant sur la classification dynamique. Les entreprises peuvent utiliser Apache Atlas pour leurs besoins de classification et l’attribution de métadonnées, appliquées ensuite via Apache Ranger pour instaurer des règles de contrôle d’accès. De plus, Atlas établit désormais un lignage entre composants. Apache Atlas a été développé par les clients et partenaires membres du projet Data Governance Initiative, parmi lesquels Aetna, Target, Merck, Schlumberger, SAS, SAP et une grande entreprise du secteur financier.

Parmi les nouvelles fonctionnalités de HDP 2.5 :
– Notebook pour l’utilisation de Spark en entreprise avec Apache Zeppelin ;
– Rationalisation des opérations avec la dernière version d’Apache Ambari ;
– Traitement des données en temps réel avec Apache Storm ;
– Analytique ad hoc en quasi temps réel et meilleur support multi-tenant avec Apache HBase et Apache Phoenix.

HDP 2.5 intègre aussi une préversion d’Apache Spark 2.0, avec les dernières innovations de la communauté pour rendre Spark encore plus simple, rapide et efficace. HDP 2.5 sera disponible au troisième trimestre 2016.

La plateforme HDP gère les données au repos et Hortonworks DataFlow (HDF) les données en transit vers le data center et dans le cloud. La suite des plateformes de données connectées de Hortonworks permet de déployer HDP et HDF pour couvrir le plus large périmètre et extraire des informations stratégiques d’un maximum de données.