Google a publié un modèle d’IA révolutionnaire appelé Gemini 2.5 Pro qui a obtenu un score de 18,8 % au dernier examen de l’humanité (HLE) sans utiliser de recherche sur le Web ou d’autres outils. Le HLE est un test rigoureux, conçu par des experts en la matière et des universitaires de haut niveau du monde entier pour tester les connaissances approfondies sur divers sujets.
Auparavant, o3-mini-high d’OpenAI avait obtenu 14 % sur le même test sans utiliser d’outils.
Gemini 2.5 Pro est un modèle de réflexion, c’est-à-dire un modèle de raisonnement construit sur un LLM de base plus large, utilisant l’apprentissage par renforcement et l’incitation à la chaîne de pensée. Avant le modèle Gemini 2.5 Pro, Google avait publié le modèle Gemini 2.0 Flash Thinking, plus petit.
Google affirme que le modèle Gemini 2.5 Pro peut « analyser des informations, tirer des conclusions logiques, intégrer le contexte et les nuances, et prendre des décisions éclairées ».
Gemini 2.5 Pro était testé sur LMArena sous le nom de code « nebula ». Aujourd’hui, Gemini 2.5 Pro a pris la première place du classement LMArena avec le score le plus élevé de 1 443 points, devançant Grok 3 et GPT-4.5. En ce qui concerne les autres tests, Google indique que Gemini 2.5 Pro obtient des résultats exceptionnels en codage, en mathématiques et en sciences.
Gemini 2.5 Pro : codage et raisonnement avancés
Dans GPQA Diamond, Gemini 2.5 Pro a obtenu un score de 84 % ; dans AIME 2025, le modèle a atteint 86,7 %. Même dans le benchmark vérifié SWE-bench qui teste la capacité à résoudre des problèmes logiciels réels, Gemini 2.5 Pro a obtenu 63,8 %, juste derrière Claude 3.7 Sonnet Extended Thinking, qui a obtenu 70,3 %.
Google affirme que le nouveau modèle Gemini 2.5 Pro est capable de codage et de raisonnement avancés. Il est mis à la disposition des utilisateurs de Gemini Advanced. Ceux qui souhaitent tester gratuitement le modèle Gemini 2.5 Pro peuvent se rendre sur Google AI Studio et sélectionner le modèle « Gemini 2.5 Pro Experimental 03–25 » dans le menu déroulant.