Google a récemment dévoilé Imagen 3, son générateur d’images à partir de texte le plus avancé à ce jour, lors de l’événement I/O en mai. Ce puissant outil Imagen 3 est désormais accessible aux utilisateurs via l’application Pixel Studio, exclusivement sur la série Pixel 9.
Ainsi, Google permet à nouveau à ses utilisateurs de générer des images de personnes par l’intermédiaire de son chatbot Gemini, après avoir retiré cette fonctionnalité au début de l’année, suite à des rapports faisant état d’images historiquement inexactes.
Les abonnés à Gemini Advanced ou ceux inscrits à la plateforme AI Test Kitchen de Google aux États-Unis peuvent également en faire l’expérience. Google prévoit d’étendre la disponibilité d’Imagen 3 à un plus grand nombre d’utilisateurs dans les jours à venir, tout en introduisant les « Gemini Gems » — un outil permettant de personnaliser Gemini et de créer des experts en IA sur divers sujets.
Selon Google, Imagen 3 établit un nouveau standard en matière de qualité d’image, permettant aux utilisateurs de générer des images dans divers styles à partir de simples descriptions textuelles. Ce modèle de génération d’images est capable de créer des paysages photoréalistes aussi bien que des peintures à l’huile texturées. Google met l’accent sur la précision des détails, l’éclairage riche et la réduction des artefacts, surpassant ainsi les autres modèles de génération d’images.
Jusqu’à présent, Imagen 3 n’était disponible que pour les abonnés à Gemini Advanced aux États-Unis, avec un support uniquement en anglais. Toutefois, Google prévoit d’étendre l’accès à toutes les applications Gemini et d’ajouter la prise en charge de toutes les langues dans les jours à venir.
Bientôt vous pourrez générer des images de personnes avec Imagen 3
En parallèle de cette extension, Google a annoncé le déploiement imminent d’une version en accès anticipé de l’outil, qui sera capable de générer des images de personnes. Cette version est accompagnée de diverses mesures de sécurité pour empêcher la génération d’images de personnes « photoréalistes et identifiables », de mineurs, ou encore de scènes excessivement violentes, sanglantes ou sexuelles.
Cette version en accès anticipé sera d’abord disponible pour les utilisateurs de Gemini Advanced, Business et Enterprise, en anglais, dans les prochains jours.