Avec Retrieval Agent Manager (RAM), SAS entend convertir les gisements de contenus non structurés en réponses contextualisées pour les métiers. Positionnée entre les bases documentaires et les LLM, la solution promet un déploiement sans code et une orchestration agentique des workflows. De quoi industrialiser le RAG à l’échelle tout en évitant de mêler données sensibles et modèles.
Tous les acteurs de la donnée et de son analyse se réinventent à l’ère de l’IA agentique. C’est forcément le cas de SAS Software qui fut l’un des premiers à prôner les capacités de l’IA bien avant que l’on ne parle d’IA générative. Et ce n’est donc pas une surprise de voir aujourd’hui l’éditeur chercher à populariser les techniques RAG et même à les industrialiser. Il lance cette semaine son Retrieval Agent Manager (RAM), un service destiné à exploiter les documents non structurés — du PDF aux e‑mails — via un pipeline RAG clé en main, extensible et compatible avec des agents. Dit autrement SAS RAM est une solution « no-code » conçue pour fournir des réponses générées par l’IA rapides, précises et contextuelles à partir des contenus non structurés de l’entreprise à l’aide des techniques RAG qui évitent l’entraînement de modèles spécifiques tout en limitant les risques d’hallucinations.
Alors que de nombreuses études montrent que la plupart des projets GenAI échouent sur l’ingestion, la qualité et la gouvernance des contenus, la solution RAM de SAS cible précisément ce chaînon faible en séparant strictement données et modèles, en automatisant la sélection de configurations et en exposant des API pour chatbots et applications. RAM ingère et traite automatiquement les documents non structurés, puis évalue et sélectionne les meilleures configurations pour permettre une interaction rapide avec les informations qu’ils contiennent.
Kathy Lange, directrice de recherche IA et automatisation chez IDC, résume ainsi l’ambition de l’éditeur : « SAS Retrieval Agent Manager transforme des données fragmentées en informations exploitables afin d’accélérer des décisions mieux éclairées. En combinant IA générative et IA agentique, RAM offre une interface pour créer et moderniser des processus sans refonte des systèmes. »
La promesse répond à une réalité têtue : l’essentiel des contenus d’entreprise échappe encore aux SI transactionnels, et leur croissance reste soutenue.
Du RAG à grande échelle
Sur le plan technique, RAM assemble plusieurs briques attendues d’un RAG « industrialisé » pour s’étendre à toute l’échelle de l’entreprise et servir tous les collaborateurs : une ingestion multiformat, des indexations vectorielles, une évaluation des chaînes de récupération et génération, et une publication des résultats (sources citées, réponses et recommandations) via API ou chatbot.
L’ensemble est en réalité par une « couche agentique » qui prend en charge des enchaînements d’actions — consultation de référentiels, déclenchement d’un flux, génération d’un compte rendu — tout en s’appuyant sur les documents de l’entreprise. SAS insiste sur le fait que les données ne servent pas à entraîner un LLM : les modèles sont appelés à l’exécution même des prompts, ce qui facilite la conformité et limite l’empreinte data.
« SAS Retrieval Agent Manager s’adapte aux très vastes volumes de données mis à jour en permanence », souligne Jason Mann, VP of IoT chez SAS. « RAM permet à une entreprise d’appliquer plus facilement des technologies comme les chatbots et l’IA conversationnelle à sa base de connaissances, d’utiliser des API robustes pour intégrer des services de connaissances basés sur l’IA générative dans des applications existantes, pour faciliter le développement d’agents IA. ».
L’éditeur promet que les mécanismes d’évaluation sous-jacents permettent à la solution de choisir les meilleurs combinaisons d’embeddings, de récupération et de génération afin de conserver des performances stables malgré l’afflux permanent de nouvelles données.
Les cas d’usage décrits par SAS couvrent plusieurs secteurs. Dans la banque et l’assurance, RAM facilite la détection de schémas suspects, l’accès rapide aux corpus de conformité (AML/KYC) et l’automatisation du traitement d’indemnisations. Dans le secteur public, la solution aide les agents à fournir des réponses homogènes dans les centres de contact. En santé, elle résume les notes cliniques et la littérature médicale pour soutenir la décision médicale. Enfin, dans l’industrie, RAM s’intègre aux systèmes de maintenance prédictive : il analyse manuels techniques, rapports d’intervention et bulletins fournisseurs pour suggérer des opérations ciblées et générer des instructions adaptées aux techniciens et ingénieurs. Avec cette idée sous-jacente que les pertes de temps proviennent souvent moins du diagnostic que de la difficulté à relier les bonnes informations dispersées dans les documentations.
Sur le marché, SAS se place face aux offres de « search & grounding » et d’agents d’AWS, Google Cloud, Microsoft ou aux plateformes spécialisées. La différenciation entre les solutions se jouera sur l’évaluation intégrée et la capacité à orchestrer des scénarios de bout‑en‑bout, y compris dans des environnements réglementaires où la séparation données/LLM reste un impératif. Pour les organisations déjà clientes de SAS, RAM prolonge un outillage familier et peut accélérer l’industrialisation des POC GenAI qui stagnent.
Si RAM tient ses engagements à l’usage, l’outil peut devenir une très intéressante et utile couche de médiation documentaire au‑dessus des dépôts hétérogènes, avec un pilotage des coûts et des risques mieux maîtrisé. Reste à vérifier, en production, la qualité des réponses sur des corpus bruités, la gestion des rôles et la réactivité quand les documents changent à haut débit.