Amazon a besoin d’accélérer dans l’IA générative. En plus d’investir dans ses propres modèles (‘Alexa LLM’, Titan, CodeWhisperer …), le géant américain veut s’adjoindre les compétences et les modèles d’Anthropic pour muscler son offre AWS BedRock. Amazon va ainsi injecter 4 milliards de dollars dans la start-up.
Ce n’est pas un rachat, mais c’est un investissement massif. Amazon – qui a décidé de construire ses offres IA génératives à son rythme sans forcément chercher la concurrence frontale avec Microsoft et Google – annonce un investissement de 4 milliards de dollars dans Anthropic, avec une injection initiale de 1,25 milliard de dollars.
Moins connue en France, la start-up est considérée outre-Atlantique comme le principal concurrent d’OpenAI. Elle a d’ailleurs été créée par des anciens d’OpenAI. La jeune pousse est principalement connue pour son LLM multimodal Claude, désormais Claude 2, aux performances conversationnelles très proches de GPT-4/ChatGPT mais disposant d’une fenêtre contextuelle bien plus large lui permettant d’absorber de grands documents et de générer l’équivalent d’un roman en une session.
Cet investissement massif d’Amazon dans Anthropic est une aubaine pour la start-up qui doit lui permettre d’accélérer est de venir concurrencer plus frontalement OpenAI grâce à un puissant partenaire, alors que l’apprentissage des modèles nécessites des ressources informatiques gigantesques et pèsent donc excessivement sur les finances de la start-up.
Car cet investissement est d’abord et surtout un partenariat bi-directionnel. Les modèles d’Anthropic étaient déjà accessibles sur AWS via l’API BedRock.
Surtout, Anthropic va désormais migrer toute son infrastructure sur AWS afin d’exploiter la puissance faramineuse disponible dans les datacenters d’Amazon mais aussi adapter ses modèles pour tirer profit des accélérateurs matériels d’AWS (les NPU Trainium et Inferentia).
Dit autrement, les futurs modèles d’Anthropic seront entraînés et exécutés sur les processeurs spécialisés d’Amazon. Cette nouvelle proximité entre les deux entreprises devraient aussi permettre à Anthropic d’influer sur le design des futures évolutions des processeurs Trainium et Inferentia.
Elle devrait également entraîner un retrait d’Alphabet qui a investi 400 millions de dollars dans Anthropic ces dernières années parallèlement à ses investissements dans sa propre filiale IA Deepmind (Anthropic a officiellement levé 1 milliard de dollars dans différents tours de table depuis sa création).
À lire également :
IA générative : Anthropic lance Claude 2
AWS muscle son offre d’IA génératives
Avec Amazon BedRock et ses modèles Titan, AWS aussi se lance dans les IA génératives
OpenAI veut aussi sa conférence développeurs !
IA générative : Anthropic lance Claude Pro, version payante de Claude 2