Les deux entreprises américaines ont lancé une investigation de grande ampleur pour savoir si DeepSeek n’a pas créé son fameux modèle « R1 » en distillant les données des modèles GPT-4o d’OpenAI, usurpant ainsi les propriétés intellectuelles et les licences d’utilisation des API de la startup américaine.

DeepSeek continue d’alimenter les débats autour des performances et coûts d’entrainement de son modèle à raisonnement « R1 » qui a, en une semaine, réussi à ébranler la confiance américaine en sa supériorité technologique sur l’IA.

Et beaucoup se demandent si la startup Chinoise n’a pas quelque peu triché voire menti non seulement sur ses capacités matérielles réelles (que certains supposent bien supérieures à ce qu’elle annonce) mais aussi sur la façon dont elle a entraîné DeepSeek R1 ainsi que le modèle plus classique qui lui sert de fondation DeepSeek S3.

Il est vrai que le rapport technique d’une cinquantaine de pages publiées par les chercheurs de la jeune pousse Chinoise comporte quelques zones d’ombre notamment sur les jeux de données utilisés mais aussi sur les modèles utilisés pour l’apprentissage par renforcement automatisé (sans intervention humaine). Car même si DeepSeek qualifie son modèle « R1 » d’open source, il paraît désormais évident qu’il répond davantage à la définition d’un modèle ouvert (ou plus exactement ‘open weight’, comme les modèles de Meta et ceux de Mistral) qu’à un véritable modèle open source tel que le qualifie l’OSI. En effet, DeepSeek n’a publié aucun code source des outils, des codes d’entraînement et des instructions d’entraînement utilisés pour former R1. Il suffit d’ailleurs d’explorer la documentation du projet « Open R1 » lancé sur la plateforme Hugging Face pour mesurer l’ampleur des éléments qui manquent pour faire de R1 un véritable modèle « open source ». Et ce manque de transparence pourrait traduire quelques petits secrets peu glorieux.

C’est en tout cas ce que pensent Microsoft et OpenAI qui viennent d’ouvrir une enquête pour violation des conditions d’utilisation de ChatGPT et GPT-4o. Plus concrètement, OpenAI accuse la start-up chinoise DeepSeek d’avoir utilisé, via la technique dite de « distillation », les sorties de ses modèles propriétaires afin de former son propre modèle concurrent open source. La distillation est une technique courante dans l’industrie IA et permet à un plus petit modèle d’apprendre à partir des résultats générés par un modèle plus grand, mais OpenAI s’inquiète que DeepSeek l’emploie dans le but explicite de reproduire et concurrencer ChatGPT.

Dans un communiqué, OpenAI affirme avoir des preuves sans toutefois les divulguer : « Nous savons que les entreprises basées en Chine — et d’autres — tentent constamment de reproduire les modèles des principales entreprises américaines d’IA ». Et d’ajouter, « nous mettons en œuvre des contre-mesures pour protéger notre propriété intellectuelle, notamment un processus minutieux de sélection des capacités avancées à inclure dans les modèles publiés, et nous pensons qu’il est crucial, pour l’avenir, de travailler en étroite collaboration avec le gouvernement américain afin de protéger au mieux les modèles les plus performants contre les tentatives des adversaires et des concurrents de s’approprier la technologie américaine ».

Voilà en tout cas une affaire qui n’est pas prête de s’éteindre et qui bouleverse bien des certitudes américaines sur leur suprématie IA et le bien fondé de leurs massifs investissements.

On rappellera quand même que nombre des optimisations et technologies utilisées par DeepSeek sont également explorées par d’autres acteurs de l’IA à commencer par la startup française Mistral AI qui elle aussi arrive à rivaliser avec les géants de la Tech malgré des budgets très inférieurs. Les techniques MoE, Mamba et d’apprentissage par renforcement sont depuis longtemps maîtrisées et utilisées dans les modèles de Mistral AI. Il ne reste plus qu’à espérer que DeepSeek aura au final surtout démontré qu’il est possible de déstabiliser les certitudes américaines et que l’Europe, avec des acteurs comme Mistral AI, peut, elle aussi, innover et s’imposer sur le marché de l’IA.

 

À lire également :

DeepSeek R1, le modèle IA open-source Chinois qui déchaine les passions [MAJ]

Après R1, DeepSeek bouleverse le monde de l’IA génératrice d’image avec Janus-Pro

Tendances 2025 : les quatre mutations majeures de l’IA en entreprise…

OpenAI annonce « o3 » : successeur du modèle « o1 » mais plus dangereux ?