Quand Meta s’offre près de la moitié de Scale AI, c’est tout le marché de la donnée annotée qui tangue : départs de clients, frictions concurrentielles et accélération des ambitions vers la super-intelligence. Un investissement qui précipite une redistribution stratégique entre acteurs majeurs de l’IA et soulève de nouveaux enjeux de souveraineté informationnelle.
Scale AI n’est sans doute pas la pépite de l’IA la plus connue, mais elle compte tous les géants de l’IA en clients. Fondée à San Francisco en 2016 par Alexandr Wang alors étudiant au MIT, la jeune pousse s’est hissée en moins de dix ans au rang de maillon essentiel de l’infrastructure de l’IA générative. Son « Data Foundry » mobilise un réseau mondial de labellisateurs et d’experts métier capables de fournir – à très grande échelle – des jeux de données annotés, des évaluations de modèles et des services d’intégration applicative. L’entreprise a réalisé environ 870 millions de dollars de chiffre d’affaires en 2024 et table sur près du double en 2025, portée par des contrats avec Google, Microsoft, OpenAI, Meta et plusieurs agences fédérales américaines, le tout pour une valorisation désormais supérieure à 29 milliards de dollars.
Enfin, tout ça c’était avant cette semaine. Car, en fin de semaine dernière, Meta confirmait injecter 14,3 milliards de dollars dans Scale AI pour en acquérir 49 % du capital – sans droits de vote – et sécuriser un partenariat commercial élargi. Alexandr Wang quitte dans la foulée la direction opérationnelle de Scale AO pour piloter la nouvelle unité « Superintelligence » de Meta, tout en conservant son siège d’administrateur. Jason Droege, ex-Uber Eats et Chief Strategy Officer de Scale AI, est nommé PDG par intérim.
Pour Meta, l’opération poursuit trois objectifs :
1 – garantir un accès privilégié à des volumes massifs de données qualifiées alors que l’entraînement de Llama doit s’accélérer ;
2 – recruter un profil rare en la personne de Wang, réputé pour sa maîtrise du pipeline données-modèle ;
3 – et, plus discrètement, déstabiliser les fournisseurs concurrents dépendants de Scale AI !
Meta insiste sur le maintien de l’indépendance de la start-up et sur l’absence de droits de regard sur les informations clients, mais admet viser « l’étape suivante de l’IA de niveau super-intelligence » en réalisant cet investissement.
L’effet « Kiss pas Cool »
Cette prise de participation a aussitôt fait réagir l’écosystème. Google, qui représentait environ 150 millions de dollars de revenus pour Scale en 2024, a arrêté plusieurs projets internes (« Genesis », « Beetle Crown ») dans les heures suivant l’annonce, craignant une fuite d’informations sensibles vers un concurrent direct.
OpenAI a confirmé de son côté qu’il « mettait fin » à la collaboration avec Scale AI, un mouvement entamé depuis six à douze mois mais accéléré par l’entrée de Meta au capital : « Nous recherchons des fournisseurs plus spécialisés et neutres », indique un porte-parole.
Microsoft, client historique de Scale AI, examine également la possibilité de rapatrier une partie du marquage de données en interne ou de diversifier ses prestataires, selon plusieurs sources proches du dossier.
Elon Musk et son laboratoire xAI ont, eux aussi, suspendu des projets, tandis que des acteurs concurrents du data-labeling observent déjà une hausse des sollicitations.
Pour Scale AI, la perte rapide de plusieurs donneurs d’ordre majeurs complique la promesse faite aux investisseurs : rester « agnostique » vis-à-vis des modèles et préserver la confidentialité des données. Le message interne de Jason Droege rendu public a beau affirmé que « Scale AI demeure, sans équivoque, une entreprise indépendante », nombreux sont ceux qui s’interrogent sur la pérennité d’une entreprise qui perd instantanément autant de grands clients. La réalité est que le risque de concentration d’activité autour d’un unique actionnaire stratégique est réel.
D’autant que cette défection de clients n’impressionnera pas Meta. Le groupe de Mark Zuckerberg a, par cet investissement colossal, d’abord cherché à sécuriser un pipeline critique de données et à renforcer ses ambitions de super-IA. Les régulateurs suivront probablement de près l’impact concurrentiel de cette alliance qui échappe pour l’instant à tout contrôle formel mais qui pourrait aussi engendrer une nouvelle dynamique sur le marché des Data Labellisateurs. À suivre…