Ça continue de bouger du côté des IA génératives et ça continuera pendant les vacances. OpenAI ouvre l’API finale de GPT-4 et lance un interpréteur de code dans ChatGPT.

Décidément, il se passe toujours quelque chose du côté des IA génératives. Et plus particulièrement du côté d’OpenAI. Avec des bonnes et de moins bonnes nouvelles.

Procès à venir et audience en stagnation

Du côté des mauvaises nouvelles, OpenAI a découvert que les auteurs Sarah Silverman, Richard Kadrey et Christopher Golden leur intentaient (ainsi qu’à Meta) un procès pour viol de droits d’auteurs après avoir découvert que leurs écrits avaient été utilisés pour l’entraînement de moteurs IA dans leur autorisation préalable. Les plaignants estiment que des fuites d’informations sur les activités IA de l’entreprise montrent que leur travail a été utilisé sans autorisation. Contre OpenAI, ils affirment que les résumés du travail des plaignants générés par ChatGPT indiquent clairement que l’IA conversationnelle a été formée sur leur contenu protégé. Une affaire à suivre car elle pourrait entraîner bien d’autres procès par la suite.

Autre mauvaise nouvelle, l’audience de ChatGPT aurait diminué de 10% entre mai et juin. Nul doute que l’effet « curiosité » s’estompe. Et que la concurrence de Bing Chat et de Bard se ressent un peu. Ceci dit, la mesure d’audience de SimilarWeb ne tient pas compte de ce qui compte vraiment pour OpenAI : les abonnés à la version payante « ChatGPT Plus » (qui sont toujours plus nombreux) et les appels à ses API par d’autres applications et IA (là aussi, ces appels sont rémunérateurs pour OpenAI).

SimilarWeb note également que Bing Chat connaît une audience assez stable avec près de 1.250.000.000 visites par mois et beaucoup plus que deux autres concurrents, CharacterAI et Google BARD qui compteraient moins de 250.000 visites mensuelles.

GPT-4 se généralise

Du côté des bonnes nouvelles, OpenAI continue son chemin. L’entreprise vient d’ouvrir son premier bureau hors USA (à Londres) et vient de créer une nouvelle équipe formée de ses plus brillants chercheurs et ingénieurs pour s’assurer que les superintelligences (les AGI ou intelligence artificielle générale) de demain ne viennent pas nuire voire détruire l’humanité : « Au cours des 4 prochaines années, nous consacrerons 20 % de la puissance de calcul dont nous disposons à la résolution du problème de l’alignement des superintelligences. Notre principal pari en matière de recherche fondamentale est notre nouvelle équipe chargée de l’alignement des superintelligences, mais il est essentiel d’y parvenir pour mener à bien notre mission et nous attendons la contribution de nombreuses équipes, depuis la mise au point de nouvelles méthodes jusqu’à leur déploiement » explique l’éditeur.

Autre bonne nouvelle, l’API de GPT-4 est désormais en « General Availability ». Pour l’instant seuls les utilisateurs d’OpenAI ayant déjà procédé à des paiements y auront accès. Mais à terme, tout le monde pourra y avoir accès, en payant. Jusqu’ici, l’accès à l’API était limité à des développeurs sélectionnés par OpenAI. Attention toutefois, des limitations s’imposent malgré cette « General Availability ». Ainsi l’accès à l’analyse d’images reste limité à des développeurs sélectionnés par OpenAI. De même la « fenêtre » de discussion reste limitée à 8000 mots. Enfin, l’API semble toujours limitée à 25 messages toutes les 3 heures. Des limites qui devraient rapidement évoluer d’autant que l’éditeur a annoncé que les anciennes versions de GPT ne seraient bientôt plus disponibles et remplacées par « GPT 3.5 Turbo ».

OpenAI a également confirmé que les API de DALL-E 2 (génération d’images) et de Whisper (transcription vocale) passaient également en « General Availability ».

Un interpréteur de code dans ChatGPT Plus

Enfin, dernière bonne nouvelle pour ceux qui codent en s’aidant de ChatGPT, un plugin « Code Interpréter » est désormais accessible aux utilisateurs de ChatGPT Plus. Cet « interpréteur de code » permet à ChatGPT d’exécuter du code Python et non simplement en générer. Typiquement, cela permet à ChatGPT de générer des diagrammes, des cartes, des visualisations de données et des graphiques, de formater des données instantanément, de nettoyer des ensembles de données, d’analyser des listes de lecture musicales, d’éditer des fichiers vidéos, de créer des fichiers HTML interactifs, de charger une image pour la transformer puis la sauver, etc. L’interpréteur débloque une myriade de capacités d’autant qu’il permet à l’IA d’accéder à des fichiers (en lecture comme en écriture), ce qui en fait un outil puissant pour la visualisation, l’analyse et la manipulation des données.

À lire également :