Le duel technologique entre OpenAI et DeepSeek prend une nouvelle tournure avec des accusations de vol de données. Après avoir bouleversé la Silicon Valley avec des modèles d’IA ultra-efficaces et bon marché, la startup chinoise DeepSeek est désormais soupçonnée d’avoir utilisé les modèles d’OpenAI pour entraîner ses propres IA.
D’après Bloomberg, Microsoft et OpenAI ont lancé une enquête pour déterminer si DeepSeek a utilisé des comptes développeurs OpenAI pour siphonner des données et entraîner son propre modèle d’IA.
Des transferts massifs de données ont été détectés fin 2024 par des chercheurs en sécurité de Microsoft, qui soupçonnent que ces transferts proviennent de comptes liés à DeepSeek.
L’enquête vise à savoir si DeepSeek a intégré l’API d’OpenAI dans son modèle, ce qui est autorisé, mais a aussi utilisé des techniques interdites de « distillation » pour récupérer les connaissances de GPT-4.
Qu’est-ce que la distillation en IA ?
Il s’agit d’une technique qui extrait des connaissances d’un puissant modèle pour les injecter dans un plus petit modèle. Elle permet d’obtenir des performances comparables avec un budget et une puissance de calcul réduits. Ainsi, DeepSeek aurait pu éviter de dépenser les plus de 100 millions de dollars qu’OpenAI a investis pour entraîner GPT-4. Si cette information est avérée, il s’agira d’une violation des conditions d’utilisation d’OpenAI.
OpenAI a déclaré au Financial Times : « Nous avons trouvé des preuves liant DeepSeek à l’utilisation de la distillation ».
Problème ? OpenAI n’a pas détaillé ces preuves, ce qui laisse planer des doutes sur la solidité des accusations. De son côté, DeepSeek n’a fait aucun commentaire et continue d’exploiter son modèle DeepSeek R1, qui concurrence ChatGPT avec un coût de développement estimé à moins de 6 millions de dollars.
Ironie de la situation ? OpenAI accuse DeepSeek de vol de données, alors que GPT-4 lui-même a été entraîné sur d’énormes quantités de contenu du web sans autorisation.
David Sacks, conseiller IA de Donald Trump, estime qu’il est « possible » que DeepSeek ait volé la propriété intellectuelle d’OpenAI. OpenAI confirme que des entreprises chinoises tentent régulièrement d’exploiter les modèles américains et demande plus de soutien du gouvernement américain pour empêcher le vol de technologies stratégiques.
Vers une nouvelle guerre technologique États-Unis–Chine ?
Les accusations d’OpenAI s’inscrivent dans un contexte de tensions croissantes entre les États-Unis et la Chine sur la maîtrise de l’intelligence artificielle.
Les enjeux :
- Protection des modèles d’IA américains contre des usages frauduleux.
- Contrôle des transferts de données et de l’accès aux infrastructures cloud (Azure, AWS, Google Cloud).
- Blocage des entreprises chinoises soupçonnées de copier les technologies américaines.
Problème pour OpenAI et Microsoft ?
Si DeepSeek a réellement utilisé GPT-4 pour entraîner son modèle, cela prouve que l’IA américaine est déjà infiltrée. De plus, si OpenAI ne parvient pas à prouver ses accusations, cela pourrait nuire à sa crédibilité, notamment face aux poursuites en cours contre son propre usage des contenus protégés.
La bataille entre OpenAI et DeepSeek ne fait que commencer, et elle pourrait bien déborder du terrain technologique pour devenir une affaire géopolitique.