Google a récemment dévoilé Gemini 2.5 Flash, un nouveau modèle d’intelligence artificielle hybride, actuellement en preview. Ce modèle est accessible gratuitement via l’application Gemini, l’API Gemini, Google AI Studio et Vertex AI.
Conçu pour offrir un équilibre optimal entre coût, performance et latence, Gemini 2.5 Flash se distingue par sa capacité à activer ou désactiver des fonctionnalités de raisonnement selon les besoins des utilisateurs.
Gemini 2.5 Flash est le premier modèle de Google à intégrer une capacité de raisonnement hybride. Cela signifie que les développeurs peuvent ajuster le niveau de « réflexion » de l’IA en définissant un budget de raisonnement via l’API ou une interface dédiée dans AI Studio ou Vertex AI. Ce budget peut varier de 0 à 24 576 tokens, permettant ainsi d’adapter la profondeur d’analyse en fonction des besoins spécifiques de chaque tâche.
Ce modèle est particulièrement adapté aux applications nécessitant une faible latence et une rentabilité accrue, tout en conservant des performances de haut niveau. Il est idéal pour des cas d’utilisation tels que les assistants conversationnels, les agents IA, les applications mobiles et les services à forte demande.
Gemini 2.5 Flash : Raisonnement contrôlable et performances solides
Gemini 2.5 Flash prend en charge des entrées multimodales, y compris le texte, les images, l’audio et la vidéo, avec une fenêtre de contexte impressionnante de 1 million de tokens. Bien que ses performances soient légèrement inférieures à celles du modèle o4-mini d’OpenAI sur certains benchmarks, Gemini 2.5 Flash offre une solution plus économique avec des performances compétitives.
La tarification de Gemini 2.5 Flash est conçue pour offrir une flexibilité maximale :
- Sans raisonnement : 0,15 dollar par millier de tokens en entrée et 0,60 dollar par millier de tokens en sortie.
- Avec raisonnement activé : à partir de 3,50 dollars par millier de tokens, en fonction du budget de raisonnement défini.
Cette structure tarifaire permet aux développeurs de choisir le niveau de complexité et de coût adapté à leurs projets.
Disponibilité et intégration
Gemini 2.5 Flash est actuellement disponible en préversion via :
- L’application Gemini.
- Google AI Studio.
- Vertex AI.
Les développeurs peuvent commencer à expérimenter avec ce modèle dès aujourd’hui en utilisant l’API Gemini. Il est important de noter que, bien que le modèle soit en préversion, il est déjà stable et prêt pour des tests en conditions réelles.
Avec Gemini 2.5 Flash, Google propose une solution innovante pour les développeurs et les entreprises recherchant un modèle d’IA performant, flexible et économique. Sa capacité à ajuster le niveau de raisonnement en fonction des besoins spécifiques en fait un outil précieux pour une large gamme d’applications.
Pour en savoir plus et commencer à utiliser Gemini 2.5 Flash, vous pouvez consulter la documentation officielle sur Google AI Studio ou Vertex AI.