Après des mois de limitations, Google permet enfin aux utilisateurs gratuits de Gemini de générer des images contenant des personnes. Cette mise à jour marque une avancée majeure pour Imagen, le moteur de génération d’images de Google, qui souffrait jusqu’ici d’un handicap majeur face à des concurrents comme DALL·E.
Jusqu’à récemment, la génération d’images avec des personnes était réservée aux abonnés de Gemini Advanced, dans le cadre d’un accès anticipé. Désormais, les utilisateurs gratuits peuvent aussi en profiter, bien que le déploiement soit encore progressif.
Ce qui change :
- Vous pouvez maintenant demander à Gemini de créer des images incluant des personnes.
- Les images générées sont généralement réalistes et bien détaillées.
- Les limites sur la diversité aléatoire des visages semblent mieux gérées qu’avant.
Les restrictions encore en place :
- Impossible de générer des personnalités célèbres ou des figures politiques.
- Gemini refuse toujours certaines requêtes ambiguës ou sensibles.
Si vous demandez « un couple qui fait du parachutisme », Gemini générera l’image sans problème. Mais demandez une personne spécifique, et l’IA refusera.
Un retour dans Gemini après un lancement problématique
Pourquoi Google avait-il désactivé cette fonction pendant des mois ? Lors de son lancement initial avec Imagen 3 en août 2024, la gestion des visages et de la diversité posait problème. L’IA appliquait des paramètres de diversité trop aléatoires, ce qui menait à des résultats aberrants, comme un George Washington noir ou d’autres incohérences historiques.
Face aux critiques, Google a préféré suspendre la fonction plutôt que de risquer des polémiques, promettant un retour rapide… qui a finalement pris plusieurs mois. Ce n’est qu’avec une nouvelle génération de modèle et un reparamétrage en profondeur que cette fonctionnalité fait son retour.
Toujours pas disponible partout
Google déploie cette mise à jour progressivement, ce qui signifie que tous les utilisateurs gratuits ne l’ont pas encore. Pour accéder immédiatement aux fonctionnalités avancées, il faut encore souscrire à Gemini Advanced, qui propose des modèles plus expérimentaux et des outils exclusifs.
Si Google rattrape enfin son retard face à la concurrence et propose des images réalistes avec des humains, il reste des restrictions sur les personnalités et un déploiement progressif qui peut frustrer certains utilisateurs.
Reste à voir comment Google va continuer à améliorer cette technologie et si elle pourra rivaliser pleinement avec DALL·E et d’autres générateurs d’images avancés.