L’IA Bing Chat, désormais dénommé Microsoft Copilot, fêtera 1 an d’existence dans quelques semaines. Et Microsoft veut marquer le coup en lançant plein de nouvelles fonctionnalités originales dont certaines commencent à être déployées dès cette semaine.

Après des rumeurs persistantes et nombreuses en janvier 2023, alors que le monde entier découvrait le potentiel des IA génératives au travers du projet de recherche ChatGPT d’OpenAI, Microsoft officialisait début février son nouveau Bing dopé à l’IA générative devenue Bing Chat puis désormais Microsoft Copilot.

Depuis l’éditeur n’a cessé d’enrichir le potentiel de son IA et de multiplier les interactions possibles allant même jusqu’à en proposer une version « entreprise » prenant soin de la confidentialité des échanges et des données.

Alors que l’IA se prépare à célébrer sa première bougie 1 an, Microsoft commence déjà à dévoiler les nouveautés qui arriveront dès le début de l’année prochaine, certaines commençant même déjà à être déployées.

Voici un aperçu de toutes les nouveautés à venir :

Avec Notebook, Bing AI vous aide à peaufiner vos prompts…

Pour tirer le meilleur des IA, il faut savoir les interroger autrement dit composer l’invite (ou prompt) idéale. Une opération qui ne se fait pas en une fois. Microsoft enrichit Copilot d’une nouvelle interface pour travailler les prompts de façon itérative. Dénommée « Notebook », elle sera proposée dans un onglet séparé des discussions.

Au lieu de proposer une expérience conversationnelle, Notebook vous propose une interface à deux volets. Le premier permet de saisir une requête, une invite (prompt). Le second renvoie instantanément la réponse à l’invite du premier volet. Il suffit de modifier ou compléter la requête du premier volet pour voir comment l’IA y répond dans le second. On peut ainsi tâtonner et peaufiner l’invite jusqu’à obtenir la réponse idéale ! C’est très pratique pour ceux qui ne veulent pas « discuter » avec l’IA mais simplement lui demander de « générer » un contenu.

La fonctionnalité serait déjà en début de déploiement.

Une multimodalité étendue

Microsoft va combiner la puissance du nouveau modèle multimodal avec la recherche d’images Bing et les données de recherche sur le web. Objectif, permettre à l’IA de mieux comprendre vos requêtes à base d’images. Jusqu’ici on pouvait envoyer à Copilot une photo et lui demander de la décrire ou de l’expliquer. Désormais on peut lui demander des choses plus compliquées impliquant de réaliser des recherches complémentaires sur le Web. Typiquement, vous téléchargez une photo ou une image et vous demandez à l’IA des informations complémentaires et non uniquement d’en décrire le contenu. Microsoft donne l’exemple d’une photo d’un décollage de fusée que vous trouvez sur un blog. Vous pouvez demander à Bing, à partir de cette photo, de retrouver de quel lancement il s’agissait.

Cette fonctionnalité est attendue prochainement.

Code Interpreter arrive bientôt

Les abonnés à ChatGPT Plus (la version payante de ChatGPT) connaissent déjà cette fonctionnalité. Elle sera bientôt disponible pour tous gratuitement dans Copilot. Elle permet d’effectuer des tâches complexes telles que des calculs plus précis, du codage, de l’analyse de données, de la visualisation, des mathématiques et bien plus encore. Pour faire simple, l’IA Copilot comprend que pour réaliser ce que vous lui demandez elle doit créer un programme en Python et l’exécuter. Elle peut même vous afficher le code Python qu’elle aura généré pour réaliser la tâche demandée. De quoi désormais faire de Copilot un assistant doué pour les maths mais également un assistant en data-science.

L’analyse de documents

En parallèle de Code Interpréter, il sera prochainement possible de télécharger dans Copilot un document pour lui demander de l’analyser sans avoir à faire de copier-coller de textes. Une fonctionnalité déjà présente dans la version payante de ChatGPT (la version Plus).

Deep Search pour aller plus loin dans vos recherches

Copilot est avant tout un outil de discussion qui répond à vos questions. Mais de plus en plus d’utilisateurs l’utilisent comme un outil de recherche profitant de sa capacité à agréger des éléments disparates en une réponse. Pour ces usages, Microsoft va proposer un tout nouveau mode : Deep Search. Vous posez une question relativement vague ou complexe. Et Bing va approfondir la recherche en combinant son savoir et GPT-4. Il va proposer différents axes complémentaires d’approfondissement du sujet que l’utilisateur pourra choisir pour indiquer sa préférence. L’IA proposera alors des résultats de recherche classés par adéquation. Microsoft prévient déjà qu’une telle recherche « en profondeur » prendra une trentaine de secondes à s’exécuter.

Nouveaux modèles

Copilot intègre dès aujourd’hui le nouveau modèle de génération d’images Dall-E 3 qui avait déjà fait son apparition dans Microsoft Designer et dans ChatGPT Plus.

Par ailleurs, Copilot va très prochainement lui aussi hériter du modèle « GPT-4 Turbo » qui anime depuis peu ChatGPT Plus. L’atout n°1 de cette version est sa fenêtre contextuelle étendue qui lui permet de comprendre de longs documents mais aussi de générer des réponses bien plus longues et complexes.

Bref, Microsoft prépare une généralisation à Copilot de la plupart des fonctionnalités payantes actuelles de ChatGPT Plus. Et il ne fait guère de doute que de nombreuses autres nouveautés viendront rythmer les évolutions de l’IA tout au long de l’année 2024… Après tout, l’ère de l’IA générative ne fait que démarrer.

 <

À lire également :