fermer
Intelligence Artificielle

Google DeepMind : Gemini Robotics, une IA révolutionnaire pour les robots polyvalents

Google DeepMind : Gemini Robotics, une IA révolutionnaire pour les robots polyvalents
Google DeepMind : Gemini Robotics, une IA révolutionnaire pour les robots polyvalents

Google DeepMind a récemment levé le voile sur deux nouveaux modèles d’intelligence artificielle dédiés à la robotique, baptisés Gemini Robotics et Gemini Robotics-ER. Ces modèles visent à révolutionner la manière dont les robots perçoivent et interagissent avec le monde physique.

Avec ces avancées, Google espère transformer les robots en véritables assistants polyvalents, capables d’exécuter des tâches complexes avec plus de précision et de sécurité que jamais auparavant.

Un pas de géant vers l’IA embarquée pour robots

Les nouvelles solutions de Google DeepMind s’appuient sur la base du modèle de langage avancé Gemini 2.0, mais ajoutent des fonctionnalités spécifiques à la robotique. Gemini Robotics introduit un système combinant vision, langage et action, permettant aux robots de comprendre les commandes vocales, d’analyser leur environnement en temps réel et d’effectuer des mouvements précis.

De son côté, Gemini Robotics-ER se concentre sur le raisonnement spatial et l’intégration avec les systèmes de contrôle robotiques existants. Ce modèle avancé ouvre la voie à des machines capables de s’adapter aux environnements dynamiques et de prendre des décisions en fonction du contexte.

Par exemple, un robot équipé de Gemini Robotics pourra reconnaître un objet, comme une banane, et la placer dans un panier sur commande vocale. De même, il pourra exécuter des tâches plus complexes comme plier un origami en suivant les principes de cette technique délicate.

Des capacités de manipulation accrues

L’un des principaux défis de la robotique réside dans l’exécution de tâches physiques complexes nécessitant une grande dextérité. En 2023, Google avait dévoilé RT-2, une IA capable d’adapter ses mouvements en fonction des commandes vocales. Cependant, ce modèle était limité à des gestes qu’il avait déjà appris, ce qui restreignait son application dans des scénarios imprévus.

Avec Gemini Robotics, Google affirme avoir franchi un cap décisif. La nouvelle IA permet désormais aux robots de réaliser des tâches nécessitant une manipulation fine, comme emballer des snacks dans des sachets refermables ou plier du papier avec précision.

Des robots plus intelligents et plus autonomes grâce à Gemini Robotics

L’un des aspects les plus prometteurs de Gemini Robotics est sa capacité à généraliser ses compétences. Google affirme que son modèle double les performances des meilleurs systèmes de vision-langage-action existants. Cette faculté de généralisation est essentielle pour que les robots puissent s’adapter à des environnements inconnus sans entraînement préalable.

Pour illustrer son ambition, Google DeepMind a annoncé un partenariat avec la startup américaine Apptronik afin de concevoir une nouvelle génération de robots humanoïdes basés sur Gemini 2.0. La technologie a été entraînée sur une plateforme bimanuale appelée ALOHA 2, mais elle est également compatible avec d’autres types de robots, y compris les bras robotiques Franka et les humanoïdes Apollo d’Apptronik.

L’intégration de l’intelligence artificielle dans les robots soulève des questions de sécurité majeures. Pour répondre à ces préoccupations, Google a mis en place une approche de sécurité multicouche comprenant des protocoles de prévention des collisions et des limitations de force pour éviter des accidents.

DeepMind s’inspire également d’Isaac Asimov et de ses célèbres Trois Lois de la Robotique en développant un cadre appelé « Robot Constitution ». De plus, l’entreprise a conçu un ensemble de tests de sécurité baptisé ASIMOV, destiné à mesurer les implications des actions robotiques dans le monde réel.

Vers une révolution de la robotique ?

Google n’a pas encore précisé quand ni comment ces nouvelles IA seront disponibles commercialement. Pour l’instant, Gemini Robotics reste en phase de recherche, bien que des entreprises comme Boston Dynamics, Agility Robotics et Enchanted Tools aient déjà accès à Gemini Robotics-ER via un programme de test restreint.

Alors que de nombreuses entreprises comme Meta, Tesla, Figure AI et Boston Dynamics travaillent sur le matériel des robots humanoïdes, Google cherche à fournir une intelligence artificielle capable d’en tirer pleinement parti. Si Gemini Robotics parvient à tenir ses promesses, nous pourrions bientôt voir des robots capables d’assister les humains dans une multitude de tâches complexes avec une précision et une autonomie inédites.

Tags : GeminiGemini RoboticsGoogle DeepMindrobotrobotique
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.