Google a déjà deux rivaux pour ChatGPT : Google Bard et Google Search SGE. Mais ils n’ont pas vraiment l’air d’être des alternatives à ChatGPT, et ils ne sont certainement pas aussi populaires. Gemini pourrait changer tout cela. Il s’agit du grand produit d’IA générative de Google qui devrait rivaliser avec le meilleur modèle ChatGPT d’OpenAI, GPT-4. Nous attendons l’arrivée de Gemini depuis l’été, et il ne semble pas que nous puissions l’utiliser au quotidien de sitôt.
Google travaille sur son nouveau Large Language Model (LLM) appelé Gemini, qui remplacera à terme son architecture d’IA actuelle PaLM 2. Il semble que Google ait initialement prévu de lancer la nouvelle génération de LLM ce mois-ci, mais le lancement aurait été retardé. Toutefois, il se pourrait que Google envisage maintenant de présenter Gemini en avant-première virtuelle.
Selon un rapport de The Information, des sources au fait de la situation affirment que des événements de lancement de Gemini non annoncés étaient prévus pour cette semaine. Ces lancements, qui auraient eu lieu à New York, Washington et en Californie, auraient été reportés à janvier 2024.
Il semble que la raison de ce retard soit due à un problème de fiabilité. Il semblerait que la fiabilité de Gemini soit quelque peu mise à mal lorsqu’il s’agit de soumettre des messages ou des demandes qui ne sont pas rédigés en anglais. Il s’agit là d’un problème majeur pour un produit que Google souhaite commercialiser dans le monde entier. Les produits d’IA générative tels que GPT-4 et Gemini devraient gérer plusieurs langues.
Bien que les événements de lancement en personne aient été retardés, nous aurons peut-être la chance de voir ce dont l’IA de nouvelle génération de Google est capable. La source anonyme du média affirme que l’entreprise prévoit maintenant de faire une présentation virtuelle qui pourrait avoir lieu dès cette semaine. Une démo virtuelle signifie qu’aucun journaliste ne pourra tester Gemini.
Dépasser GPT-4 ?
Gemini est l’architecture d’IA la plus puissante de Google à ce jour, et l’entreprise espère qu’elle égalera, voire dépassera, GPT-4 d’OpenAI. Sa principale caractéristique est qu’elle est multimodale et qu’elle peut être entraînée sur d’autres éléments que le texte. Gemini serait capable de générer du texte, des images, du son, des vidéos et d’autres types de données.
Une démonstration de la version encore inachevée de Gemini pourrait être une victoire pour Google dans le paysage actuel de l’IA. OpenAI a connu un bouleversement majeur au cours des dernières semaines, en licenciant puis en réembauchant son PDG pour des raisons encore inconnues. Selon certaines théories, les inquiétudes concernant une grande avancée pourraient être à l’origine de cette situation, comme un précurseur de l’IA. D’autres affirment que des divergences plus mineures entre Sam Altman et le conseil d’administration pourraient être à l’origine de ce remue-ménage.
Le report du GPT Store personnalisé, combiné au fait qu’OpenAI restreint toujours l’accès à ChatGPT Plus, est également des développements qui jouent en faveur de Google. C’est certainement le moment de sortir Gemini, en supposant qu’il puisse offrir une expérience décente à la hauteur de GPT-4. Jusqu’à présent, les efforts de Google en matière d’IA, comme Bard et SGE, ont été pour le moins médiocres.
Un nouveau rôle dans l’IA
L’arrivée de Gemini ne mettrait pas seulement la pression sur OpenAI. Elle pourrait également rassurer les investisseurs de Google. ChatGPT est toujours considéré comme le leader de l’IA, et à juste titre.
Google était en retard à cette fête, mais a fini par exploiter le système d’exploitation mobile le plus utilisé au monde. Il pourrait en être de même avec l’IA, mais ce que j’attends, c’est une concurrence accrue qui, je l’espère, favorisera une innovation sûre dans ce domaine.
Google n’a pas encore annoncé sa démo Gemini. Comme il s’agit d’un événement virtuel, l’entreprise pourrait faire son annonce à tout moment de la semaine.