Une startup chinoise spécialisée en intelligence artificielle, DeepSeek, a récemment dévoilé une approche novatrice visant à améliorer l’efficacité et la précision des modèles d’IA grâce à une technique appelée « Self-Principled Critique Tuning » (SPCT).
Cette méthode, décrite dans un article préliminaire en collaboration avec l’Université Tsinghua, propose une boucle de rétroaction en temps réel où le modèle d’IA génère ses propres principes et critiques pour affiner continuellement ses réponses.
Traditionnellement, l’amélioration des modèles d’IA repose sur l’augmentation de leur taille et sur des processus d’entraînement coûteux en ressources humaines et informatiques. En revanche, la méthode SPCT permet au modèle de s’auto-évaluer en comparant ses réponses à des critères prédéfinis, générant ainsi des signaux de récompense qui guident son apprentissage futur. Cette approche, connue sous le nom de « Generative Reward Modeling » (GRM), vise à créer des modèles capables de s’améliorer de manière autonome.
Le modèle résultant de cette technique, baptisé DeepSeek-GRM, a démontré des performances supérieures à celles de modèles concurrents tels que Gemini de Google, Llama de Meta et GPT-4o d’OpenAI, selon les benchmarks présentés dans l’étude. DeepSeek prévoit de rendre ce modèle accessible en open source, favorisant ainsi l’innovation collaborative dans le domaine de l’IA.
L’idée d’une IA capable de s’améliorer de manière autonome soulève des débats au sein de la communauté technologique. Des figures, telles que Eric Schmidt, ancien PDG de Google, ont exprimé la nécessité de mécanismes de contrôle pour ces systèmes auto-améliorés, suggérant même la mise en place d’un « kill switch » pour prévenir tout comportement imprévu. Néanmoins, des entreprises comme Meta et Google explorent également des approches similaires, telles que les modèles de langage auto-récompensés et les algorithmes d’auto-amélioration.
DeepSeek, l’IA venue de Chine !
L’initiative de DeepSeek s’inscrit dans un contexte plus large où la Chine encourage activement le développement et l’intégration de l’IA dans divers secteurs. De nombreuses entreprises chinoises, y compris des fabricants de smartphones comme Huawei, OPPO et Vivo, ont déjà adopté les modèles d’IA de DeepSeek pour améliorer leurs produits et services.
En résumé, la méthode SPCT de DeepSeek représente une avancée significative dans le domaine de l’intelligence artificielle, offrant une nouvelle voie pour le développement de modèles plus intelligents et autonomes, tout en suscitant des discussions essentielles sur la gouvernance et la sécurité de ces technologies émergentes.