Seulement quelques semaines après le déploiement de Gemini, le Large Language Model de Google destiné à révolutionner le secteur de l’IA, la firme de Mountain View annonce déjà son successeur : Gemini 1.5. Accessible dès aujourd’hui pour les développeurs et les entreprises, en prélude à un lancement grand public imminent, Google mise pleinement sur Gemini comme outil professionnel et assistant personnel.
Gemini 1.5 se distingue par de nombreuses améliorations, notamment Gemini 1.5 Pro, la version grand public, qui rivalise désormais avec Gemini Ultra, le modèle haut de gamme récemment introduit. Surpassant Gemini 1.0 Pro dans 87 % des benchmarks, Gemini 1.5 utilise une technique de plus en plus répandue, le « Mixture of Experts » (MoE). Cette méthode permet d’activer seulement une partie du modèle pour une requête donnée, optimisant ainsi la rapidité d’utilisation pour l’utilisateur et l’efficacité opérationnelle pour Google.
L’innovation majeure de Gemini 1.5 réside dans son contexte élargi, capable de traiter des requêtes bien plus vastes et d’examiner une quantité d’informations considérable en une seule fois. Avec une fenêtre de contexte atteignant le million de tokens, bien au-delà des 128 000 de GPT-4 d’OpenAI et des 32 000 de l’actuel Gemini Pro, cette avancée permet d’aborder des contenus d’une ampleur sans précédent. Sundar Pichai, PDG de Google, simplifie la comparaison : « cela représente environ 10 ou 11 heures de vidéo, des dizaines de milliers de lignes de code ».
Cette capacité étendue ouvre des perspectives nouvelles, tant pour les utilisateurs individuels que pour les entreprises. Pichai évoque la possibilité pour les cinéastes de soumettre un film entier à Gemini pour anticiper les critiques, ou pour les entreprises d’analyser d’immenses volumes de données financières. « Je considère cela comme l’une de nos percées les plus significatives, » affirme-t-il.
Pour l’instant, Gemini 1.5 est exclusivement disponible pour les utilisateurs professionnels et les développeurs via Vertex AI et AI Studio de Google. À terme, il remplacera Gemini 1.0, et la version standard de Gemini Pro, accessible à tous via gemini.google.com et les applications de l’entreprise, sera mise à niveau vers 1,5 Pro, avec une fenêtre de contexte de 128 000 tokens. L’accès à la fenêtre d’un million de tokens sera soumis à un surcoût. Google teste également les limites de sécurité et d’éthique du modèle, notamment en ce qui concerne la nouvelle fenêtre de contexte élargie.
Une course à l’IA
Dans la course effrénée pour développer le meilleur outil d’IA, Google semble prendre une longueur d’avance, notamment pour ceux déjà intégrés dans son écosystème. Cependant, la concurrence reste vive, notamment avec les récentes annonces d’OpenAI concernant la « mémoire » pour ChatGPT et ses ambitions dans la recherche Web.
Selon Pichai, l’évolution rapide de la technologie sous-jacente continue de captiver l’attention du public, même si, à terme, l’expérience utilisateur primera sur les détails techniques.
Cette initiative de Google marque une étape importante dans le développement des capacités de l’IA, ouvrant la porte à des applications plus vastes et plus complexes. Reste à voir comment ces avancées seront adoptées par les développeurs et les entreprises, et quel impact elles auront sur l’évolution future des modèles d’IA générative.