OpenAI, l’entreprise derrière ChatGPT, vient de franchir un nouveau cap dans le domaine de l’intelligence artificielle. Après des mois d’attente, OpenAI a finalement présenté une série de nouveaux modèles appelés « o1 » qui excellent dans le raisonnement avancé, et qui étaient auparavant appelés « Strawberry ».

Les nouveaux modèles comprennent o1, o1-preview et o1-mini. Les modèles o1-preview et o1-mini sont disponibles dès aujourd’hui pour les utilisateurs payants de ChatGPT Plus. À une date ultérieure, o1-mini sera également disponible pour les utilisateurs gratuits de ChatGPT.

Selon OpenAI, les modèles o1 ont besoin d’un certain temps de réflexion avant de générer une réponse, mais ils peuvent « raisonner à travers des tâches complexes » et résoudre des problèmes plus difficiles en mathématiques, en sciences et en codage. En outre, OpenAI affirme que les nouveaux modèles de raisonnement obtiennent des résultats équivalents à ceux d’étudiants en doctorat sur des sujets scientifiques difficiles.

OpenAI o1 solves a complex logic puzzle. pic.twitter.com/rpJbh8FkAg
— OpenAI (@OpenAI) September 12, 2024

Ainsi, bien que ces modèles ne puissent pas encore récupérer des informations en temps réel sur le Web ni utiliser des fichiers et des images pour le contexte, ils sont déjà capables de rivaliser avec des étudiants en doctorat en physique, chimie et biologie.

Pour vous donner un point de repère, le modèle OpenAI o1 a obtenu un score de 83 % dans un examen rigoureux comme l’Olympiade internationale de mathématiques (OIM), alors que GPT-4o n’a pu résoudre que 13 % des problèmes. Et dans la compétition Codeforces, le nouveau modèle o1 a atteint le 89e percentile alors que GPT-4o s’est contenté du 11e percentile. Dans le benchmark MMLU, OpenAI o1 a obtenu un score de 92,3 et dans le benchmark MATH, un score de 94,8. OpenAI affirme que dans les tâches nécessitant un raisonnement approfondi, o1 se rapproche des performances des experts humains, ce qui est assez significatif.

Des applications concrètes et prometteuses de OpenAI o1

OpenAI met en avant plusieurs exemples d’utilisation de ces nouveaux modèles d’IA dans la vie réelle, notamment l’annotation de données de séquençage cellulaire, la génération de formules mathématiques complexes pour l’optique quantique et l’exécution de workflows en plusieurs étapes.

En parallèle, l’entreprise propose également un modèle de raisonnement plus abordable et plus rapide, o1-mini, que les développeurs peuvent intégrer pour créer des applications nécessitant un raisonnement logique, mais pas forcément une connaissance approfondie du monde.

Une sécurité renforcée

OpenAI a également mis au point un nouveau système de formation à la sécurité pour permettre aux nouveaux modèles de « raisonner sur nos règles de sécurité en contexte », ce qui devrait leur permettre de les appliquer plus efficacement. L’entreprise affirme que ces modèles ont réussi des tests rigoureux de « jailbreaking » (tentatives de contournement des garde-fous) avec des scores bien supérieurs à ceux des modèles précédents.

Les modèles o1 ont été formés à l’aide d’une technique de chaîne de pensée par apprentissage par renforcement. Ils décomposent les étapes en étapes plus simples et abordent chaque étape par le biais de différentes stratégies jusqu’à ce qu’ils parviennent à la bonne conclusion. Par ailleurs, les modèles o1 ne prennent actuellement en charge que les entrées textuelles. Vous ne pouvez pas utiliser le modèle pour naviguer sur le web ou analyser des fichiers et des images.

Comme indiqué précédemment, si vous utilisez ChatGPT Plus ou ChatGPT Team, vous pouvez accéder à ces nouveaux modèles o1 dans l’application. Les utilisateurs de ChatGPT Enterprise et Edu y auront accès à partir de la semaine prochaine.

GTA 6 : le PlayStation Store tease un gros titre pour l’automne 2025, est-ce enfin le bon ?

Voyage d’été : Google dévoile de nouvelles fonctionnalités IA pour faciliter la planification et l’exploration

Microsoft modernise l’écran de connexion : Fluent 2, sans mot de passe et mode sombre Xbox

Vivaldi et Proton VPN : la nouvelle référence pour une navigation web privée et sécurisée

Test des Huawei FreeBuds Pro 4 : Son haute-fidélité à un prix abordable !

Test des Xiaomi OpenWear Stereo : Une alternative aux écouteurs intra-auriculaires ?

Test du Microsoft Surface Laptop 7 : Une surprenante renaissance avec le Snapdragon X Elite

Test du Xiaomi 14T Pro, le flagship killer qui n’a pas peur des grands

Galaxy Tab S10 FE/FE+ : un nouveau design et un modèle plus grand que jamais

POCO F7 Pro et F7 Ultra : smartphones OLED 2K, Snapdragon 8 Elite et charge ultra-rapide pour 2025

MediaTek Dimensity 9500 : le SoC le plus puissant en approche, le Dimensity 9400+ arrive dès le 11 avril

Des rendus officiels du Galaxy S25 Edge émergent avant son lancement en avril

OpenAI Academy : Une plateforme éducative gratuite pour tous, du débutant à l’expert IA

ChatGPT suspend la génération d’images après une popularité inattendue de GPT-4o et du style Ghibli

Microsoft 365 Copilot : Researcher et Analyst, deux agents IA pour une automatisation avancée

OpenAI GPT-4o : ChatGPT génère images et vidéos avec une qualité inédite

Vibe Coding : L’IA peut-elle vraiment remplacer les développeurs ? Les dangers du « code à l’aveugle »

Discord Social SDK : l’intégration gratuite des fonctionnalités sociales Discord dans les jeux vidéo

Claude Code : Des bugs critiques dès le lancement, les développeurs en colère

Gemini Code Assist : l’IA de Google pour coder devient gratuite et défie la concurrence !

Migrer de Google à Proton : e-mails, mots de passe, fichiers, le guide étape par étape

Connecter Android et Windows : toutes les solutions pour utiliser vos applis sur PC !

Time Machine : Le guide complet pour sauvegarder votre Mac

Que faire avec un Raspberry Pi ? 6 idées originales pour le réutiliser

OpenAI repousse les limites de l’IA avec ses modèles « o1 » pour le raisonnement complexe

Des applications concrètes et prometteuses de OpenAI o1

Une sécurité renforcée

Vivo X200 : Un nouveau rival de taille face à l’iPhone 16 attendu en octobre

Polaris Dawn : l’aube d’une nouvelle ère pour le tourisme spatial

The author Yohann Poiron

OpenAI repousse les limites de l’IA avec ses modèles « o1 » pour le raisonnement complexe

Des applications concrètes et prometteuses de OpenAI o1

Une sécurité renforcée

The author Yohann Poiron

vous pourriez aussi aimer