OpenAI bouscule l’écosystème IA : ses nouveaux modèles « open weight » rencontrent un énorme intérêt et définissent de nouveaux sommets pour l’IA en open source. Ils débarquent sur Windows, s’installent sur Ollama et s’invitent sur toutes les grandes plateformes cloud, ouvrant la voie à l’IA personnalisable pour tous et par tous.

OpenAI a frappé fort en lançant cette semaine deux modèles LLM à raisonnement en « open weight », une première pour la startup depuis plus de 5 ans et la sortie de son modèle GPT-2 alors passé inaperçu du grand public (c’était bien avant ChatGPT et son modèle GPT-3 au lancement). Ces modèles sont assez proches en performance des modèles propriétaires « OpenAI o3 » et « OpenAI o4-mini ».

Et la jeune pousse star de l’IA s’est assurée que son modèle soit bien présent dès le lancement sur toutes les plateformes qui comptent, de GitHub à Hugging Face, de Azure AI Foundry à Orange Business Live Intelligence, de Google Vertex AI à … AWS ! Et oui ! AWS, grâce à la publication « ouverte » de ces nouveaux modèles, obtient enfin la possibilité d’embarquer des modèles signés OpenAI sur ses deux plateformes phares que sont Amazon Bedrock et Amazon Sagemaker !

Mais les modèles « open-weight » d’OpenAI, dénommés « gpt-oss-20b » et « gpt-oss-120B », ne sont pas destinés uniquement à rejoindre les grandes plateformes IA du Cloud. Le premier des deux est suffisamment compact pour s’exécuter en local sur des PC (notamment dotés d’un GPU ou d’un NPU) alors que le second est pensé pour des déploiements sur serveur et pour fonctionner avec un seul GPU.

Et Microsoft a confirmé l’arrivée de ces modèles non seulement sur Azure AI Foundry mais aussi sur Windows AI Foundry. Cette plateforme annoncée lors de la dernière conférence Build est conçue pour faciliter le développement, le déploiement et l’exécution de modèles IA directement sur les appareils Windows, sans dépendre du cloud.

Selon Microsoft, « les nouveaux modèles d’OpenAI sont conçus pour un déploiement dans le monde réel, que ce soit pour du raisonnement à grande échelle dans le cloud ou pour des tâches agentiques à la périphérie [NDLR Comprenez également le PC] ». Et pour l’éditeur, le grand intérêt de ces modèles est que les développeurs peuvent entièrement les personnaliser et les « fine-tuner » à l’aide des outils avancés et conviviaux fournis dans Azure AI Foundry. Et le modèle gpt‑oss-20b – tel quel ou une fois fine-tuné – peut être déployé localement sur des PC Windows modernes et bientôt sur MacOS grâce à « Local Foundry », la couche sur laquelle est construite Windows AI Foundry.

Le modèle nécessite un PC avec un GPU discret Nvidia doté d’au moins 16 Go de VRAM ou alors un Copilot+ PC avec un processeur Snapdragon X Elite (et son NPU intégré) ou même un PC doté d’un iGPU Intel tant qu’il a plus de 16 Go de RAM partagée. D’autres configurations seront bientôt supportées.

Dans son billet de blog, Microsoft laisse sous-entendre que la firme proposera prochainement des versions plus optimisées encore de « gpt-oss-20B », on imagine probablement avec une quantification 4 bits.

Outre « Local Foundry », « gpt-oss-20b » est également disponible via l’AI Toolkit de Visual Studio Code.

Hors des autoroutes Microsoft, il existe un autre moyen d’inférer le petit modèle ouvert d’OpenAI en utilisant Ollama et sa toute nouvelle application Windows dotée d’une interface visuelle très conviviale (jusqu’ici Ollama était un outil en ligne de commandes). Il suffit d’installer l’application, de la lancer, puis de sélectionner le modèle à utiliser (devinez quoi, c’est justement gpt-oss-20b qui est sélectionné par défaut !). Il suffit alors de dialoguer avec le modèle depuis l’interface de Ollama, un peu comme vous le feriez avec ChatGPT).

