Google a transformé la recherche sur le Web en un simple jeu de questions/réponses. ThoughtSpot entend transformer aussi radicalement la recherche dans les données structurées.
Quatre des sept fondateurs de ThoughtSpot sont des anciens de Google. Pas surprenant qu’ils aient développé une approche similaire dans le domaine de la Business Intelligence et les données organisées sous forme de tables composés de lignes et de colonnes. D’ailleurs, une telle approche est désormais courante dans de nombreux domaines : recherche d’un hôtel dans Kayak, d’un contact dans LinkedIn, d’un produit dans Amazon ou encore d’un restaurant dans Yelp.
Scott Holden, directeur marketing de ThoughtSpot présente ThoughtSpot comme le représentant de la 3e génération de la BI. Après du mainframe et de l’infocentre, la première génération de la BI à partir des années 80 a ouvert une voie en facilitant les requêtes SQL. Business Objects en a été un des inspirateurs avant d’être rachetée par Oracle. La BI 2.0 a été défrichée avec les solutions de visualisation qui ont largement améliorée les capacités d’interprétation et de compréhension des utilisateurs.
Malgré les améliorations, la BI reste une activité complexe qui est largement limitée à des profils bien définis : Les Business Analysts avec Tableau, les Data Analysts avec Cognos ou les Data Scientists avec SAS. Même avec les outils de visualisation Tableau, explique Scott Holden, une initiation nécessite trois journées de formation. Dans ce contexte, ThouthtSpot a objectif d’élargir la BI à un ensemble beaucoup plus large d’utilisateurs. En 2020, ThoughtSpot espère avoir quelque 20 millions d’utilisateurs. Autre constatation avec les outils actuels, plus on est loin de l’IT et plus il est difficile de découvrir des données pertinentes ou des relations.
Lancée par ThoughtSpot, la BI 3.0 associe la simplicité de la recherche sur le Web et la performance apportée par le traitement In-Memory c’est-à-dire en mémoire RAM. Aucun cubes, agrégations, tableaux récapitulatifs ou marts de données ne sont nécessaires pour optimiser les performances. En conséquence, la fidélité des données source est maintenue, permettant aux utilisateurs finaux de poser des questions flexibles sur les données à n’importe quel niveau. Comme Google inspecte régulièrement le Web pour indexer, l’outil de ThoughtSpot ausculte les tableaux de chiffres pour trouver les relations et les indexer et permettent ensuite les recherches. A l’instar du PageRank qui définit le niveau des pages, ThoughtSpot attribue un DataRank.
La démarche avec ThoughtSpot est légèrement différente de la recherche sur le Web. Dans cette dernière, l’internaute écrit sa requête en langage naturel et le moteur lui retourne des pages de résultats sachant que bien souvent il ne va beaucoup plus loin que la première page. Avec ThoughtSpot, la recherche est interactive avec des possibilités par le moteur de faire des suggestions permettant ainsi d’affiner les requêtes.
Créé en 2012, ThoughtSpot est déjà entré dans le dernier carré magique du Gartner sur la Business Intelligence et les plates-formes analytiques. La startup a levé plus de 100 millions permettant de financer un développement rapide.
ThoughtSpot propose sa solution sous trois formes commerciales : un logiciel à installer on-premise avec un module de base pour 4 nœuds et 256 Go de mémoire RAM avec un licence annuelle ou tri-annuelle, une solution cloud disponible sur AWS ou encore une appliance à partir de 70 000 dollars par nœud.
ThoughtSpot annonce une nouvelle solution d’analyse embarquée Search-Driven disponible avec ThoughtSpot Extended Enterprise Edition qui peut être intégré dans toute autre application. ThoughtSpot Extended Enterprise s’appuie sur l’architecture analytique de nouvelle génération, propulsée par Relational Search. Cette nouvelle génération d’architecture de BI et de moteur de calcul en mémoire calcule des réponses à la volée à travers des milliards de lignes de données provenant de n’importe quelle source, offrant des performances inférieures à la moyenne.
L’élargissement de la portée de l’intelligence d’entreprise au-delà des frontières des entreprises requiert un cadre de gouvernance souple et évolutif pouvant s’adapter à un grand nombre d’utilisateurs et de groupes de sécurité. ThoughtSpot fournit un contrôle d’accès granulaire de colonne, d’objet et de rangée à un seul modèle de données partagé qui s’échelonne sur des centaines de milliers de groupes de sécurité. Des autorisations précises garantissent que seuls les utilisateurs autorisés ont accès au bon ensemble de données.
Des façons flexibles d’intégrer ThoughtSpot
ThoughtSpot propose de nombreuses options pour injecter rapidement des analyses dans des applications, des portails ou des flux de travail personnalisés.
L’intégration de Relational Search apporte toute la puissance de l’expérience de recherche de ThoughtSpot dans n’importe quelle application. Combinez cela avec des tableaux et des tableaux de bord enfichables pour intégrer toute visualisation dans le flux de travail d’une application. Une API étendue de données et de métadonnées basée sur REST offre aux clients un contrôle complet pour implémenter un ensemble personnalisé de résultats de requête à partir de ThoughtSpot. De plus, ThoughtSpot propose des solutions personnalisées de marquage, de marquage blanc et d’OEM.
Les tendances de la BI selon le Gartner
- D’ici à 2020, les capacités de découverte de données intelligentes et gouvernées, Hadoop / Spark, recherche et visuelles convergeront en un seul ensemble de capacités de découverte de données de prochaine génération en tant que composants des plate-formes modernes de BI et d’analyse.
- D’ici 2021, le nombre d’utilisateurs des plateformes modernes de BI et d’analyse qui seront différenciées par les capacités de découverte de données intelligentes croîtra à un rythme deux fois supérieur à ceux qui ne le sont pas et donnera deux fois plus de valeur commerciale.
- D’ici 2020, la génération en langage naturel et l’intelligence artificielle constitueront une caractéristique standard de 90% des plates-formes de BI modernes.
- D’ici 2020, 50% des requêtes analytiques seront générées à l’aide de la recherche, du traitement en langage naturel ou de la voix, ou seront générées automatiquement.
- D’ici 2020, les organisations qui offrent aux utilisateurs l’accès à un catalogue curatif de données internes et externes réaliseraient deux fois la valeur commerciale des investissements analytiques que celles qui n’en ont pas.
- D’ici à 2020, le nombre de chercheurs en sciences des citoyens croîtra cinq fois plus vite que le nombre de chercheurs en données.