L’application Imagen de Google existe depuis 2022 et est mise à jour chaque année. Après Imagen 2, Imagen 3 fait ses débuts cette année lors de la conférence des développeurs Google I/O. Cette partie de la conférence a été prise en charge par Demis Hassabis, directeur de Google DeepMind.
Pour ceux qui l’ignorent, Imagen est le modèle d’IA de Google pour la génération de texte à image qui, comme son nom l’indique, vous permet de créer des images générées par l’IA à l’aide de prompts textuels. Demis Hassabis, directeur de Google DeepMind, poursuit en expliquant comment :
…il s’agit de notre meilleur modèle à ce jour pour générer du texte, ce qui a été un défi pour les modèles de génération d’images. Lors de comparaisons côte à côte, des évaluateurs indépendants ont préféré Imagen 3 à d’autres modèles populaires de génération d’images
Demis nous donne également quelques références, en comparant le dernier générateur de médias d’IA avec son prédécesseur, Imagen 2. En comparaison, Imagen 3 est apparemment plus « créatif et détaillé ». Il ajoute également que,
De plus, il s’agit de notre meilleur modèle pour générer du texte, ce qui a été un défi pour les modèles de génération d’images.
Aussi séduisant que puisse être un nouveau générateur d’images par l’IA, il suscite naturellement des inquiétudes quant à l’existence de contrefaçons profondes. Toutefois, Google semble avoir réfléchi à la question, puisqu’il a également indiqué que Imagen 3 utiliserait SynthID de Google. Cela permet à Google d’appliquer une couche invisible de filigrane aux médias générés, ce qui permettra aux utilisateurs de distinguer ces images.
We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO pic.twitter.com/XMrQYGeSiO
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Imagen 3 disponible dans le AI Test Kitchen
Google utilise de nombreux autres termes tels que « photoréaliste », « incroyablement détaillé », « moins d’artefacts distrayants » et tout un tas de charabia marketing IA. Cependant, cette fois encore, nous ne savons rien des données d’entraînement que Google utilise pour ses outils d’IA tels que Imagen 3.
En ce qui concerne sa disponibilité, Imagen 3 peut être utilisé via l’outil ImageFX disponible dans le AI Test Kitchen de Google. Toutefois, avant de pouvoir le tester, vous devez vous inscrire. Pour ce faire, rendez-vous sur la page de l’outil ImageFX et sélectionnez Paramètres en bas de page. Imagen 3 devrait également être intégré à Vertex AI.
Vous constaterez que l’outil utilise par défaut Imagen 2, mais que pour la « meilleure qualité », vous pourrez utiliser Imagen 3, ce qui nécessite une demande d’accès. Vous devrez alors remplir un rapide formulaire Google et, une fois que vous l’aurez soumis, croisez les doigts en espérant obtenir l’accès le plus rapidement possible. Quant aux développeurs et aux entreprises, ils y auront accès « bientôt » par l’intermédiaire de Vertex AI.