Créer des agents IA capables de véritables interactions complexes, c’est l’objectif des nouveaux outils lancés par OpenAI. Entre une API plus puissante et un SDK qui fluidifie la collaboration entre agents, la promesse est séduisante… mais la route vers une IA agentique fiable reste encore longue.

On le sait, l’année 2025 sera marqué par la multiplication des agents IA. Et si le marketing américain essaye de nous faire croire aux miracles et de nous convaincre que cette révolution est déjà là, la réalité est bien différente avec beaucoup d’agents qui ne sont en réalité qu’en accès limités ou en PoC.

Logique tout est encore à faire et la maturité n’est pas encore à l’ordre du jour. Et dans le « tout reste à faire », OpenAI a lancé cette semaine quelques outils importants pour permettre la création d’Agents IA capables de choses vraiment utiles.

La nouvelle API Responses

Au cœur de ces outils se trouve la nouvelle API Responses, qui remplacera l’API Assistants d’ici mi-2026. Cette API combine la simplicité de Chat Completions avec les capacités d’appels de service et d’actions de l’API Assistants, permettant aux développeurs de créer des applications « agentiques » avec un minimum de code.

Avec un seul appel API, les développeurs peuvent désormais exécuter des tâches complexes nécessitant plusieurs outils et interactions avec le modèle. Parmi les nouvelles tâches rendues possibles, certaines s’appuient sur trois nouveaux outils intégrés dans l’API :

* Recherche web : Permet d’obtenir des réponses actualisées avec citations de sources pertinentes. Compatible avec les modèles GPT-4o et GPT-4o mini, cet outil affiche des performances impressionnantes, avec des scores de 90% et 88% respectivement sur le benchmark SimpleQA. Tarif : 30$ et 25$ par millier de requêtes.

* Recherche de fichiers : Facilite l’extraction d’informations pertinentes à partir de grands volumes de documents. L’outil prend en charge plusieurs types de fichiers et offre des fonctionnalités avancées comme l’optimisation des requêtes et le filtrage par métadonnées. Tarif : 2,50$ par millier de requêtes et 0,10$/Go/jour pour le stockage (premier Go gratuit).

* Utilisation d’ordinateur : Permet aux agents d’effectuer des tâches sur un ordinateur, propulsé par le même modèle « Computer-Using Agent » (CUA) que l’outil Operator d’OpenAI. Bien que puissant, l’entreprise précise que le modèle n’est pas encore totalement fiable pour l’automatisation des tâches sur les systèmes d’exploitation. Tarif : 3$ par million de tokens d’entrée et 12$ par million de tokens de sortie.

Agents SDK : orchestrer les workflows multi-agents

En complément de l’API, OpenAI a également lancé l’Agents SDK, une boîte à outils open-source qui simplifie l’orchestration des workflows multi-agents. Amélioration de leur SDK expérimental Swarm, ce nouvel outil offre :

* Des agents IA facilement configurables avec instructions claires

* Des « transferts » intelligents entre agents

* Des « garde-fous » configurables pour la validation des entrées/sorties

* Des outils de visualisation et d’observabilité pour déboguer et optimiser les performances

Le SDK est compatible avec l’API Responses, l’API Chat Completions et même avec des modèles d’autres fournisseurs, tant qu’ils proposent un point d’accès API de style Chat Completions.

Ce n’est qu’un début… l’IA agentique n’est que naissante

Ces nouveaux outils sont essentiels pour le développement d’Agents ancrés dans la réalité numérique des entreprises et leurs besoins. Mais il en faudra d’autres. OpenAI reconnaît que les agents IA d’aujourd’hui sont encore très loins d’être parfaits voire même très loin d’être fiables. Les outils de recherche web peuvent encore commettre des erreurs factuelles dans environ 10% des cas, et le modèle CUA n’atteint qu’un taux de réussite de 38,1% sur le benchmark OSWorld pour les tâches complètes d’utilisation d’ordinateur.

On peut néanmoins voir tous ces nouveaux outils comme les premières pierres d’une plateforme plus vaste dédiée aux agents IA chez OpenAI, avec d’autres améliorations prévues dans les mois à venir.

