Rivery propose une plateforme SaaS d’ETL/ELT prenant en charge les pipelines de données. L’éditeur a mis à jour sa déclinaison pour MS Azure.

La plateforme SaaS ETL/ELT de Rivery repose d’abord sur une boite à outils de connecteurs avec des bases de données, avec des systèmes de fichiers, et, plus largement, avec la plupart des applications SaaS majeures utilisées pour la relation client, la finance, les RH… Pour les sources qui ne sont pas couvertes, Rivery fournit un connecteur générique d’API REST.

L’éditeur a optimisé sa solution destinée à Azure SQL, basé sur le moteur SQL Server. Celui-ci permet de verser et de synchroniser dans cette plateforme toutes les sources. Rivery identifie d’abord la structure des données des systèmes sources, puis crée automatiquement les schémas de données, à savoir les tables, colonnes et index, dans l’instance Azure SQL. Il reste possible de remplacer ou modifier ces structures avant la synchronisation entre les systèmes sources et Azure.

La solution inclut une prise en charge étendue de la synchronisation. Elle utilise à la fois la capture des données de changement (CDC) et l’extraction standard basée sur SQL. Lors du chargement de données à partir de SQL Server, Rivery prend en charge une troisième méthode basée sur le suivi des modifications, qui est plus efficace que CDC, mais ne couvre pas tous les cas d’utilisation couverts par CDC.

Plusieurs pipelines de données peuvent être orchestrés en un flux de travail complet. Par exemple, il est possible d’extraire et de charger des données d’un serveur MS SQL « on prem », de les joindre à une base de données MongoDB et à des données extraites de la plateforme de ecommerce Shopify. Il est également possible de transformer les données à l’aide de scripts Python personnalisés.

