Avec son nouveau modèle agentique « Mu », Windows 11 passe à la vitesse supérieure en matière d’IA embarquée : Les Copilot+ PC voient émerger un nouvel agent IA ultra-réactif, conçu pour comprendre et exécuter les personnalisations systèmes exprimées par l’utilisateur en langage naturel. Microsoft mise sur la rapidité, la pertinence et la spécialisation extrême de Mu pour révolutionner la façon d’interagir avec son ordinateur.
L’ère des Copilot+ PC n’a pas encore vraiment démarré mais un an après leur annonce les choses semblent se mettre progressivement en place et les usages et fonctionnalités dédiées se multiplient.
Pour rappel, les Copilot+ PC sont cette nouvelle catégorie de PC « IA » dotés en standard d’un NPU de 40 TOP minimum afin d’exécuter des SLM et autres modèles génératifs en local sur le PC. Jusqu’ici, Microsoft poussait en standard sur les Copilot+ PC un modèle « maison » dénommé « Phi-Silica » et dérivant des modèles « Phi 3.5 » élaborés en open source par Microsoft Research.
Mais l’idée de Microsoft a toujours été que Windows 11 allait pouvoir s’appuyer sur plusieurs modèles optimisés « Copilot+ PC » et simultanément exécutés sur le NPU.
L’éditeur a dévoilé cette semaine un nouveau modèle de langage compact (un micro-SLM) destiné à être directement intégré à Windows 11 pour une exécution en local sur le NPU des Copilot+ PC.
Dénommé « Mu », ce modèle agentique est, contrairement à « Phi-Silica », ultra-spécialisé. Il anime un nouvel agent IA au sein de l’application Pamètres de Windows 11. Celui-ci est capable de comprendre les requêtes en langage naturel et d’agir ensuite en lieu et place de l’utilisateur pour régler Windows selon les besoins de l’utilisateur. L’utilisateur formule une requête en langage naturel (« Augmenter la luminosité de l’écran externe », par exemple) et l’agent traduit instantanément la demande en appel de fonction système.
Pour des requêtes trop courtes ou ambiguës, la recherche lexicale classique reste prioritaire au sein de l’application Paramètres Windows afin de préserver la pertinence. Le modèle Mu en revanche excelle davantage sur des requêtes multi-mots exprimant une intention claire. C’est dans ce contexte qu’il est appelé lors d’une recherche depuis les Paramètres Windows.
Les innovations techniques de Mu
Avec des centaines de paramètres système à gérer, l’agent doit interpréter correctement les intentions utilisateur tout en maintenant une latence inférieure à 500 millisecondes. Microsoft a entraîné le modèle sur 3,6 millions d’échantillons couvrant des centaines de paramètres, utilisant des approches synthétiques pour l’étiquetage automatique et l’injection de variantes linguistiques.
L’architecture technique de Mu repose sur une approche encoder-decoder comptant 330 millions de paramètres. Cette conception permet d’atteindre une latence réduite de 47% sur le premier token et une vitesse de décodage 4,7 fois supérieure comparée à un modèle decoder-only de taille similaire. Le modèle exploite pleinement les NPU pour délivrer entre 100 et 200 tokens par seconde en exécution locale, répondant ainsi aux exigences strictes d’une expérience utilisateur fluide. Les ingénieurs ont multiplié par 1 300 le volume de données d’entraînement, couvrant désormais plusieurs centaines de réglages, afin d’obtenir une réponse sous la barre des 500 millisecondes. L’entraînement de Mu s’est effectué sur des GPU NVIDIA A100 via Azure Machine Learning, suivant plusieurs phases distinctes. Microsoft a d’abord pré-entraîné le modèle sur des centaines de milliards de tokens éducatifs de haute qualité, avant d’appliquer une distillation des connaissances depuis les modèles Phi. Cette approche permet à Mu d’atteindre des performances comparables à Phi-3.5-mini malgré une taille dix fois inférieure.
L’initiative est intéressante à plus d’un titre. Elle démontre la capacité de Windows à orchestrer l’exécution de modèles sur les NPU embarquées. Et elle en dit long sur l’intérêt des petits modèles ultra-spécialisés et la façon dont ces derniers peuvent totalement bouleverser l’usage du PC, de ses logiciels et des ses fonctionnalités. Enfin, elle montre que petit à petit la valeur des Copilot+ PC se dévoile. Avec les fonctionnalités IA embarquées dans Windows (Recall, Click to Do, Cocreator, Restyle Image, live captions, etc.), celles ajoutées par les constructeurs pour offrir une expérience plus personnelle (comme HP AI Companion) et l’arrivée de logiciels PC exploitant les NPU (Adobe Photoshop, DaVinci Resolve, CapCut, Clipchamp, etc.), un nouvel univers PC très différent de l’univers classique est en train d’éclore. Ce n’est qu’un début, mais acheter un PC non « Copilot+ » aujourd’hui vous condamne à une obsolescence rapide.
Mu est disponible pour les membres du programme Windows Insider via la build 26120.3964 (KB5058496). Microsoft prévoit d’élargir progressivement le périmètre fonctionnel et sollicite les retours des testeurs pour affiner l’expérience avant un déploiement grand public.
.