Durant le Week-End, OpenAI a déployé une nouvelle version de son principal modèle « GPT-4o ». Une nouvelle version qui se voulait plus intelligente et plus conviviale. Mais les choses ont mal tourné…

La semaine dernière, OpenAI avait révisé ses plans en officialisant « OpenAI o3 » et « OpenAI o4 », deux nouveaux modèles à raisonnement alors même qu’un mois plus tôt, la jeune pousse avait annoncé vouloir concentrer ses efforts sur son premier modèle hybride « GPT-5 » et ne plus sortir de variantes de ses modèles « OpenAI o ». Raison de ce revirement, l’intégration des mécanismes de raisonnement « o » dans ses modèles « GPT » s’avère plus compliquée que prévu.

Néanmoins les travaux avancent et OpenAI espérait commencer à le démontrer en introduisant ce Week-End une nouvelle variante de GPT-4o avec davantage de capacité de raisonnement, donc plus intelligente.

Au passage, OpenAI annonçait avoir également soigné la « personnalité » de son IA pour qu’elle se montre plus conviviale, voire plus affable. En l’occurrence, « trop » affable…

Quarante-huit heures après avoir déployé sa nouvelle version de GPT-4o, OpenAI a du tempéré son enthousiasme. Sur X, son CEO, Sam Altman, reconnaît que le chatbot « est devenu trop obséquieux et agaçant », tout en saluant « des améliorations réelles » par ailleurs. Sous le capot, la mise à jour du 26 avril apporte en effet des avancées : meilleure gestion des « mémoires » de conversation, renforcement des performances en mathématiques, informatique et sciences naturelles, ainsi qu’un guidage plus ferme vers des résultats « productifs ».

Seulement voilà, la nouvelle version a aussi un travers qui n’avait apparemment pas été détecté par l’éditeur. De nombreux utilisateurs ont immédiatement pointé sur les réseaux une très fâcheuse tendance du modèle à la complaisance et à la surenchère d’accords, une tendance perçue comme contre-productive dans les environnements professionnels et agaçante dans un usage quotidien grand public. Et certains de traiter l’IA ChatGPT de « Schizophrène » ou de conduire l’utilisateur à la schizophrénie.

Sam Altman au lancement avait vanté « une personnalité accrue ». Celle-ci ne plait clairement pas, à tout le monde !

Les premiers correctifs comportementaux ont commencé à être distribués dès aujourd’hui, permettant à ChatGPT de retrouver un peu de retenue. D’autres suivront dans la semaine affirme également Sam Altman qui admet par ailleurs qu’« à terme, il faudra clairement proposer plusieurs modes d’interaction », autrement dit plusieurs « personnalités », soulignant le besoin de flexibilité de l’IA pour s’adapter aux différents contextes d’usage.

Côté API, l’endpoint « chatgpt-4o-latest » pointe automatiquement vers cette version en cours d’ajustement. Pour les développeurs qui privilégient la stabilité, OpenAI rappelle qu’il vaut mieux désormais privilégier sa nouvelle série de modèles GPT-4.1 (uniquement disponibles en API), présentée comme une alternative plus constante.

Reste que de tels changements un peu à l’emporte-pièce ont de quoi inquiéter les DSI. L’éditeur invoque le manque de méthodologies capables de mesurer finement les évolutions d’un modèle, décrivant un processus de calibration « artisanal » mobilisant plusieurs équipes. Mais l’incident évoque une nouvelle fois le manque de transparence dans l’évolution comme dans le fonctionnement des modèles et le manque de visibilité sur les dérives potentielles d’un service qui est aujourd’hui très largement intégré dans les workflows.

 

À lire également :

En fait, les IA à raisonnement peuvent halluciner plus que les IA classiques

OpenAI lance ses modèles « o3 » et « o4-mini », des IA douées pour analyser les images, réfléchir et programmer

OpenAI aussi se met aux modèles « Nano » avec GPT 4.1

OpenAI : une levée record sous multiples conditions…

OpenAI améliore les capacités de génération d’images de ChatGPT