DataStax présente DataStax Enterprise (DSE) Graph, une base de données orientée graphe scalable, destinée aux applications cloud devant gérer des données fortement connectées. S’appuyant sur Apache Cassandra et construit sur le framework open source orienté graphe Apache TinkerPop, DSE Graph offre une disponibilité continue, des performances prédictibles et une montée en charge adaptée aux systèmes modernes gérant des données complexes et en mouvement.

Présentation de DataStax Enterprise Graph

Inspirée de la base de données graphe scalable open source Titan, dont DataStax a intégré les équipes suite au rachat de Aurelius en 2015, DSE Graph exploite une nouvelle suite de composants étendent les capacités de base proposées par Titan, autorisant ainsi une migration depuis Titan et d’autres bases de données graphes supportées par TinkerPop.

DSE Graph hérite des atouts clés de Cassandra, notamment sa disponibilité continue, sa fonctionnalité de lecture/écriture distribuée, sa scalabilité linéaire, ses temps de réponse à faible latence prédictibles. DSE Graph intègre également des extensions d’entreprise provenant de DataStax Enterprise, parmi lesquelles la protection des données, la sécurité avancée, la recherche d’entreprise et l’analyse intégrées, des outils de supervision, de développement et d’administration visuelle.

DSE Graph fait partie de la plate-forme multi-modèles de DSE. DSE supporte les modèles de données clé-valeur et tabulaires, les modèles JSON/ document et les graphes, chacun de ces modèles de données héritant des atouts clés de Cassandra et des fonctionnalités d’entreprise de DSE

DataStax Enterprise Graph est composée des éléments suivants :

– DataStax Enterprise Server : Ce composant offre les fonctionnalités d’une base de données graphe incluant un optimiseur de requêtes intelligent, le partitionnement automatique des données graphes, un moteur d’exécution de requêtes distribuées, ainsi que des structures d’indexation spécifiques aux graphes, tous conçus pour accroître la performance des applications graphes en ligne.
– DataStax OpsCenter : Une nouvelle version pour la gestion, la supervision et le provisioning complets de DSE Graph.
– DataStax Studio : Une nouvelle solution web permettant aux développeurs de visualiser le graphe et d’optimiser le temps de développement avec l’écriture/exécution de requêtes graphes.
– Drivers DataStax : Disponibles pour tous les langages de développement courants et optimisé pour supporter le langage de développement graphe Gremlin, ainsi que les API DSE Analytics/Search et CQL.

Cas d’utilisation spécifiques aux graphes

« Les graphes constituent une excellente méthode pour évaluer, révéler et analyser des relations entre des données jusqu’ici méconnues, explique Mark Beyer et Nick Heudecker dans une note intitulée « Making Big Data Normal With Graph Analytics . Au lieu d’examiner et d’analyser des données sous la forme d’éléments distincts et indépendants, un graphe permet de mettre en évidence la fréquence, la force et l’orientation des relations entre ces données. »

Il existe toute une série de cas où le recours à une base de données graphe est mieux adaptée que d’autres systèmes de gestion de bases de données. Parmi ceux-ci on peut citer, la gestion des données référentielles, la détection des fraudes et l’internet des objets.

« A l’avenir, les architectures et les déploiements de SGBD seront multi-modèles, considère le Gartner. Les principaux SGBD opérationnels proposeront des modèles de données multiples, relationnels et NoSQL, au sein d’une plateforme unique ».

 

 

 


Base de données orientée graphe

Une base de données orientée graphe est une base de données orientée objet utilisant la théorie des graphes, donc avec des nœuds et des arcs, permettant de représenter et stocker les données.
Une base de données orientée graphe correspond à un système de stockage capable de fournir une adjacence entre éléments voisins : chaque voisin d’une entité est accessible grâce à un pointeur physique. C’est une base de données orientée objet adaptée à l’exploitation des structures de données de type graphe ou dérivée, comme des arbres.
Les bases de données orientées graphes sont utilisées aujourd’hui dans la modélisation des réseaux sociaux : LinkedIn utilise par exemple ce système avec un graphe représentant les personnes et leur relations, et parvient ainsi facilement à afficher le degré de séparation entre chaque contact, qui n’est finalement que la distance entre les nœuds.
Elles sont de même utilisées dans le stockage de masse de données ou Big data, avec ainsi un enjeu important à l’heure actuelle dans l’exploitation des données par leur structure adaptée.

Comparaison avec les bases de données relationnelles

Les bases de données relationnelles sont plus adaptées à des requêtes de type « trouver toutes les entités de type X » grâce aux structures internes des tables. Cela est d’autant plus vrai lorsqu’il s’agit de réaliser des opérations d’agrégation sur toutes les lignes d’une table.
En revanche elles sont moins efficaces sur l’exploitation des relations car ceci nécessite une mise en place d’index. Comme cela a été dit plus tôt, les bases de données orientées graphes permettent de parcourir les relations grâce à des pointeurs physiques ce qui n’est pas le cas des clefs étrangères (bases relationnelles) qui offrent uniquement des pointeurs logiques.
Les bases de données graphes sont donc plus adaptées en termes de performance lorsqu’il s’agit de manipuler des volumes de données importants et une profondeur de graphe élevée.

(Source : Wikipedia)