Avec l’annonce de Gemini 2.0, Google a officiellement présenté Project Mariner, un prototype novateur conçu pour exécuter des tâches directement dans un navigateur Web. Ce projet marque une étape importante dans l’évolution des interactions entre les humains et les agents intelligents.
Project Mariner : Un navigateur autonome
Alimenté par le dernier modèle Gemini 2.0, Project Mariner est une extension de navigateur capable de comprendre et d’interagir avec les éléments visibles sur une page Web. Formulaires, champs de texte, codes, images : rien n’échappe à son analyse.
Fonctionnalités clés :
- Interaction active : L’extension peut taper, défiler et cliquer dans l’onglet actif pour accomplir des tâches, comme remplir des formulaires ou naviguer entre les pages.
- Confirmation utilisateur : Pour des actions sensibles, comme effectuer un achat, Project Mariner demande une validation finale de l’utilisateur avant d’agir.
- Démonstration en direct : Lors d’une démo, Project Mariner a extrait des noms d’entreprises depuis un Google Sheet, recherché leurs sites web et collecté leurs coordonnées.
Performance impressionnante et améliorations à venir
Dans le test WebVoyager, qui évalue la capacité des modèles IA à accomplir des tâches Web complexes, Project Mariner a obtenu un score record de 83,5 %, le plus élevé à ce jour. Cependant, Google reconnaît que le prototype est encore lent et parfois imprécis, mais promet des progrès rapides grâce à des collaborations avec des testeurs de confiance. Aucune date de lancement public n’a encore été confirmée.
Project Astra: Une IA Multimodale Plus Puissante
Parallèlement, Google a dévoilé des améliorations pour Project Astra, initialement présenté lors de Google I/O 2024. Ce projet repose également sur Gemini 2.0 et vise à offrir des expériences d’interaction multimodales enrichies.
Nouvelles capacités de Project Astra :
- Compréhension multilingue : Astra peut désormais interpréter et répondre dans plusieurs langues.
- Intégration avec d’autres outils : Il utilise Google Search, Maps, et Lens pour fournir des informations et des services en temps réel.
- Mémoire améliorée : Avec une mémoire en session de 10 minutes, Astra offre une personnalisation accrue pour des interactions plus fluides.
- Latence réduite : Google a significativement optimisé la vitesse de traitement pour des réponses quasi instantanées.
Google prévoit d’intégrer Astra à l’application Gemini et à d’autres dispositifs, comme des lunettes connectées.
Avec Project Mariner et Astra, Google réinvente les interactions IA dans des domaines variés, de la navigation Web au développement logiciel en passant par les jeux vidéo. Ces projets s’inscrivent dans une vision à long terme où les agents intelligents travaillent en tandem avec les utilisateurs, tout en maintenant une supervision humaine pour garantir sécurité et fiabilité.
Bien que des dates de lancement publiques pour Mariner et Astra n’aient pas encore été annoncées, leurs promesses technologiques ouvrent la voie à une nouvelle ère d’intelligence artificielle interactive.