L’intelligence artificielle développée par DeepSeek est en train de secouer l’industrie technologique. Cette startup chinoise a explosé sur le devant de la scène après que son application de chatbot soit devenue l’application la plus téléchargée sur l’App Store d’Apple, surpassant ChatGPT.
Son approche révolutionnaire et ses modèles d’IA à faible coût ont poussé les analystes de Wall Street et les experts en technologie à se demander si les États-Unis pourront maintenir leur leadership en IA et si la demande en puces Nvidia restera aussi forte à l’avenir.
Mais d’où vient DeepSeek et comment cette entreprise a-t-elle pu atteindre une notoriété internationale aussi rapidement ?
DeepSeek : des origines dans le trading quantitatif
DeepSeek est financé par High-Flyer Capital Management, un fonds spéculatif quantitatif chinois qui utilise l’IA pour ses stratégies de trading. Fondé par Liang Wenfeng, un passionné d’IA ayant débuté en bourse alors qu’il était étudiant à l’Université de Zhejiang, High-Flyer a officiellement vu le jour en 2019 en mettant au point des algorithmes financiers basés sur l’intelligence artificielle.
En 2023, la société a décidé de créer DeepSeek, un laboratoire entièrement dédié à la recherche et au développement de modèles d’IA avancés. Avec High-Flyer comme investisseur, DeepSeek est devenu une entreprise indépendante.
Dès ses débuts, DeepSeek a bâti ses propres centres de données pour entraîner ses modèles d’IA. Mais comme de nombreuses entreprises chinoises, la startup a été affectée par les restrictions américaines sur l’exportation de matériel technologique avancé. Pour entraîner ses modèles, elle a dû utiliser des puces Nvidia H800, une version bridée des puces H100, exclusivement réservées aux entreprises américaines.
Malgré ces contraintes, DeepSeek a su recruter de jeunes talents et attirer des chercheurs en intelligence artificielle issus des meilleures universités chinoises. Fait intéressant : la startup embauche aussi des personnes sans formation en informatique pour élargir les capacités de compréhension de ses modèles, selon The New York Times.
Des modèles d’IA à la pointe de la technologie
DeepSeek a dévoilé ses premiers modèles en novembre 2023 avec DeepSeek Coder, DeepSeek LLM et DeepSeek Chat. Mais ce n’est qu’au printemps suivant, avec DeepSeek-V2, que l’entreprise a réellement attiré l’attention du secteur.
Le modèle DeepSeek-V2, capable d’analyser du texte et des images, s’est rapidement imposé dans plusieurs benchmarks d’IA, tout en étant bien plus économique à exploiter que ses concurrents. Résultat ? Alibaba et ByteDance ont dû réduire les prix d’utilisation de leurs propres modèles, et certains sont même devenus gratuits pour rester compétitifs.
Puis, en décembre 2024, DeepSeek a lancé DeepSeek-V3, renforçant encore sa réputation. Selon ses propres tests internes, DeepSeek-V3 surpasserait même GPT-4o d’OpenAI et Claude 3.5 Sonnet d’Anthropic.
Cependant, le modèle le plus marquant reste DeepSeek R1, lancé en janvier 2025. Ce modèle de « raisonnement » est conçu pour vérifier ses propres réponses, ce qui lui permet d’éviter certains pièges dans les domaines complexes comme les sciences, les mathématiques et la physique.
Censure et limites
Toutefois, DeepSeek reste soumis aux régulations du gouvernement chinois. Tous ses modèles doivent respecter les valeurs socialistes fondamentales dictées par Pékin. Concrètement, DeepSeek R1 ne répondra pas aux questions sur Tiananmen ou sur l’indépendance de Taïwan.
Une stratégie disruptive et un modèle économique incertain
Ce qui distingue DeepSeek de ses concurrents, c’est son modèle économique agressif. L’entreprise propose ses services bien en dessous des prix du marché et offre même certains de ses modèles gratuitement.
Selon DeepSeek, ses innovations en optimisation informatique lui permettent de réduire drastiquement les coûts. Mais certains experts doutent de la véracité de ces affirmations.
Quoi qu’il en soit, l’écosystème de l’IA a rapidement adopté DeepSeek. Bien que ses modèles ne soient pas entièrement open source, ils sont disponibles sous des licences permissives, permettant leur utilisation commerciale. Sur la plateforme Hugging Face, plus de 500 modèles dérivés de DeepSeek R1 ont déjà été créés et téléchargés plus de 2,5 millions de fois.
DeepSeek bouleverse l’industrie et inquiète les États-Unis
L’essor fulgurant de DeepSeek a été décrit comme « un bouleversement de l’IA », marquant une nouvelle ère de compétition.
Preuve de son impact, l’action Nvidia a chuté de 18 % en une seule journée, suite à la montée en puissance de DeepSeek. Même Sam Altman, le PDG d’OpenAI, a dû réagir publiquement, saluant DeepSeek comme « un modèle impressionnant » tout en réaffirmant que son entreprise continuerait d’investir massivement en calcul intensif.
Quel avenir pour DeepSeek ?
L’entreprise chinoise va sans aucun doute continuer d’améliorer ses modèles. Cependant, elle devra faire face à une pression croissante des États-Unis, qui voient dans DeepSeek une menace pour leur domination en IA.
Avec des performances comparables aux modèles américains pour une fraction du coût, DeepSeek pourrait bien redéfinir le paysage de l’intelligence artificielle dans les années à venir.