Avec Nova Forge, un service plutôt unique en son genre, AWS ne propose pas de fine-tuner des modèles mais bien de forger vos propres modèles frontières à partir de vos données et d’industrialiser la création de modèles sur mesure…

Depuis deux ans, DSI et data scientists jouent avec les leviers disponibles, on-prem ou dans le cloud, pour « adapter » les modèles d’IA : prompt engineering, RAG, fine-tuning supervisé, un peu de RLHF. C’est souvent suffisant pour des bots internes ou des assistants bureautiques mais beaucoup moins pour encapsuler un vrai savoir métier dans un modèle préexistant.

Le problème est simple. Le fine-tuning, tel qu’on le pratique aujourd’hui, intervient en bout de chaîne sur un modèle déjà pré-entraîné. On corrige des comportements, on spécialise des usages, mais on ne reconfigure pas les représentations profondes apprises sur des corpus généralistes. Résultat, le modèle parle mieux votre jargon, mais reste fondamentalement généraliste.

Ceux qui tentent le « continued pre-training » vont plus loin et prolongent l’entraînement d’un modèle sur leurs données propriétaires. Mais à mesure que l’on pousse cet entraînement, un autre problème surgit : le modèle commence à « oublier » une partie de ses compétences générales. On gagne en expertise métier, on perd en robustesse, en capacité à suivre les instructions et même en sécurité. C’est le fameux « catastrophic forgetting » connu de tous ceux qui ont poussé trop loin le fine-tuning d’un modèle.

La solution, avoir son propre modèle maison. Sauf qu’entraîner un modèle frontière de zéro reste un sport de milliardaires. Il faut des dizaines de milliers de GPU, des pipelines de données planétaires, une infrastructure de calcul massive mobilisée pendant des jours, des stacks logicielles optimisées, des équipes de recherche de haut niveau et une gouvernance réglementaire lourde. Autant dire que la plupart des DSI n’iront jamais sur ce terrain. A moins que… un hyperscaler ne décide d’industrialiser toute la chaîne de création d’un modèle frontière pour en faire un simple service WEB.

Cet hyperscaler s’appelle AWS… Et son service SaaS de création de modèles frontières sur mesure se nomment Nova Forge, l’une des grandes surprises de l’AWS re:Invent 2025 qui se tient cette semaine à Las Vegas !

Nova Forge : forger son propre Nova plutôt que partir de zéro

Nova Forge est un service qui permet aux clients de partir des modèles Nova et d’en dériver leurs propres variantes, baptisées « Novellas ». L’idée clé est d’ouvrir la boîte noire de l’entraînement en donnant accès à des checkpoints Nova à différents stades, et pas uniquement au modèle final figé comme on le fait quand on « fine-tune » un modèle open-weight.

Plutôt que de se contenter d’un fine-tuning superficiel, les équipes IA reprennent un Nova en cours de route et poursuivent son entraînement en mélangeant leurs données métier avec des corpus Nova préparés par AWS. C’est le principe du « data mixing » : injecter en permanence un socle de données généralistes pour préserver les capacités génériques du modèle tout en le spécialisant progressivement sur le domaine du client.

On obtient ainsi des modèles qui restent des modèles frontières en termes de capacités, mais qui ont intégré en profondeur la culture métier d’une entreprise, d’un secteur ou d’un cas d’usage. Les premiers exemples cités concernent des industries très réglementées, des plateformes de contenus ou de la R&D scientifique.

Nova Forge vise clairement le haut de gamme. Le ticket d’entrée évoqué tourne autour de 100 000 dollars par an. Ce n’est pas une fonctionnalité supplémentaire de Bedrock, mais une offre d’ingénierie IA destinée aux grandes organisations qui veulent faire de leur modèle un avantage compétitif, et pas seulement une brique de commodité.

Sous le capot : open training, RFT et Bedrock

Sur le plan technique, Nova Forge s’appuie sur SageMaker AI et les clusters HyperPod pour fournir l’infrastructure d’entraînement distribuée. Les data scientists pilotent le tout via SageMaker Studio. Ils sélectionnent le checkpoint Nova de départ (pré-, mid- ou post-train), déclarent leurs jeux de données, configurent le mélange avec les jeux Nova, puis lancent les jobs d’entraînement selon des recettes optimisées par AWS.

L’originalité ne tient pas seulement à « l’open training ». Nova Forge intègre plusieurs briques qui intéressent directement les DSI et leurs équipes IA. On peut brancher ses propres environnements d’évaluation et faire du Reinforcement Fine-Tuning à partir de fonctions de récompense métiers. Les décisions d’un modèle peuvent être scorées par un simulateur interne, un moteur de règles, un jumeau numérique industriel, puis réinjectées dans la boucle d’apprentissage.

Le service embarque aussi des mécanismes de « responsible AI » intégrés pour paramétrer les garde-fous de sûreté, de sécurité et de modération en fonction des politiques internes. Enfin, des capacités de distillation et de génération de données synthétiques permettent de dériver, à partir d’un Novella, des modèles plus compacts et ciblés pour certains workloads.

Une fois forgé, le modèle est publié comme modèle privé dans Bedrock. Il bénéficie des mêmes API unifiées, des mêmes contrôles d’accès, de la même auditabilité et du même écosystème d’agents que les autres modèles supportés. En pratique, l’entreprise branche ses agents Bedrock sur « son » Nova, sans refondre toute son architecture.

Revers de la médaille, cette intégration serrée a un prix. Les modèles produits par Nova Forge restent liés à l’architecture Nova et à Bedrock. Ils ne sont pas conçus pour être exportés et réhébergés ailleurs. C’est un vrai modèle frontière sur mesure, mais profondément enraciné dans l’écosystème AWS.

Nova 2, carburant de la Forge

Nova Forge n’est pas dissocié de la roadmap modèle d’AWS. Il repose sur la nouvelle génération Nova 2, qui devient de facto le socle de cette stratégie. Les premiers Novellas peuvent dès aujourd’hui être construits à partir de Nova 2 Lite.
Les clients pourront prochainement accéder, via Nova Forge, à Nova 2 Pro et Nova 2 Omni dans une logique de co-entraîner dès les phases amont de ces modèles.

Pour AWS, le lien est stratégique. Nova 2 sert de vitrine face à GPT, Claude ou Gemini. Nova Forge transforme cette vitrine en produit de différenciation pour les grands comptes : vous n’achetez plus seulement un modèle, vous forgez votre propre variante, avec l’aide des équipes AWS, à partir de la même lignée technologique.

Certes, Nova Forge ne s’adresse pas à toutes les organisations. Il cible celles qui ont déjà franchi plusieurs paliers de maturité IA, disposent d’une base solide sur AWS, d’équipes IA structurées et de données métiers réellement différenciantes. Mais après l’ère des grands modèles génériques et celle du fine-tuning opportuniste, une troisième phase s’ouvre. Les modèles les plus stratégiques seront des variantes frontières co-entraînées avec les données, les métriques et les contraintes des clients. La personnalisation se déplace du niveau des prompts et du RAG vers le cœur même du cycle d’entraînement, sans obliger les entreprises à devenir elles-mêmes des laboratoires de recherche.

Aux DSI de décider si elles restent consommatrices de modèles standard ou si elles veulent investir dans cette co-construction, en acceptant une dépendance accrue à une plateforme. Reste que Nova Forge leur offre une option nouvelle et pour l’instant unique : une forge industrielle pour aligner un modèle frontière sur leur réalité, sans avoir à le bâtir seules.

 

À lire également :

AWS Re:Invent 2025 : Amazon dévoile Trainium3 et annonce déjà Trainium4

Azure AI Foundry offre enfin un environnement complet et cohérent

AgentKit : OpenAI relance la bataille des SDK agentiques

Claude Opus 4.5 : Anthropic remet un coup de boutoir dans le plafond de verre des LLM

Gemini 3 est là : La riposte foudroyante de Google pour accaparer le trône de l’IA