L’application Imagen de Google existe depuis 2022 et est mise à jour chaque année. Après Imagen 2, Imagen 3 fait ses débuts cette année lors de la conférence des développeurs Google I/O. Cette partie de la conférence a été prise en charge par Demis Hassabis, directeur de Google DeepMind.

Pour ceux qui l’ignorent, Imagen est le modèle d’IA de Google pour la génération de texte à image qui, comme son nom l’indique, vous permet de créer des images générées par l’IA à l’aide de prompts textuels. Demis Hassabis, directeur de Google DeepMind, poursuit en expliquant comment :

…il s’agit de notre meilleur modèle à ce jour pour générer du texte, ce qui a été un défi pour les modèles de génération d’images. Lors de comparaisons côte à côte, des évaluateurs indépendants ont préféré Imagen 3 à d’autres modèles populaires de génération d’images

Demis nous donne également quelques références, en comparant le dernier générateur de médias d’IA avec son prédécesseur, Imagen 2. En comparaison, Imagen 3 est apparemment plus « créatif et détaillé ». Il ajoute également que,

De plus, il s’agit de notre meilleur modèle pour générer du texte, ce qui a été un défi pour les modèles de génération d’images.

WM A photo of.max 2000x2000.form jpg — Exemple de Imagen 3

Aussi séduisant que puisse être un nouveau générateur d’images par l’IA, il suscite naturellement des inquiétudes quant à l’existence de contrefaçons profondes. Toutefois, Google semble avoir réfléchi à la question, puisqu’il a également indiqué que Imagen 3 utiliserait SynthID de Google. Cela permet à Google d’appliquer une couche invisible de filigrane aux médias générés, ce qui permettra aux utilisateurs de distinguer ces images.

We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO pic.twitter.com/XMrQYGeSiO
— Google DeepMind (@GoogleDeepMind) May 14, 2024

Imagen 3 disponible dans le AI Test Kitchen

Google utilise de nombreux autres termes tels que « photoréaliste », « incroyablement détaillé », « moins d’artefacts distrayants » et tout un tas de charabia marketing IA. Cependant, cette fois encore, nous ne savons rien des données d’entraînement que Google utilise pour ses outils d’IA tels que Imagen 3.

WM Clay sculp.max 2000x2000.form jpg — Exemple de Imagen 3

En ce qui concerne sa disponibilité, Imagen 3 peut être utilisé via l’outil ImageFX disponible dans le AI Test Kitchen de Google. Toutefois, avant de pouvoir le tester, vous devez vous inscrire. Pour ce faire, rendez-vous sur la page de l’outil ImageFX et sélectionnez Paramètres en bas de page. Imagen 3 devrait également être intégré à Vertex AI.

Vous constaterez que l’outil utilise par défaut Imagen 2, mais que pour la « meilleure qualité », vous pourrez utiliser Imagen 3, ce qui nécessite une demande d’accès. Vous devrez alors remplir un rapide formulaire Google et, une fois que vous l’aurez soumis, croisez les doigts en espérant obtenir l’accès le plus rapidement possible. Quant aux développeurs et aux entreprises, ils y auront accès « bientôt » par l’intermédiaire de Vertex AI.

Reddit en panne : Impossible d’accéder aux subreddits !

YouTube Music Recap 2024 : Découvrez vos artistes et chansons préférés de l’année

Windows 11 sur Meta Quest 3 : Travaillez en VR avec votre PC !

Bose acquiert McIntosh Group : L’audio de luxe et l’automobile révolutionnés ?

Test du Lenovo Yoga 9i (2024) : Le 2-en-1 premium se perfectionne avec la puce Intel Core Ultra

Test du Honor Magic V3 : Le smartphone pliable le plus fin du monde est arrivé !

Test du FlexiSpot E7 Pro : Le bureau debout qui allie robustesse, stabilité et design élégant

Test du Google Pixel 9 Pro XL, l’IA et l’autonomie révolutionnent le smartphone

OPPO Reno 13 et 13 Pro : Performances boostées avec le Dimensity 8350 et design élégant

Oura s’associe à Dexcom pour intégrer le suivi du glucose à sa bague connectée

Android 16 : Vos dossiers médicaux disponibles dans Health Connect au format FHIR !

OnePlus Pad Pro de 13 pouces : Plus grand pour encore plus de possibilités ?

Snapdragon X Elite Gen 2 : Le PC Windows du futur avec Oryon v3 ?

ChatGPT-5 : OpenAI face à des défis majeurs dans sa quête de l’IA avancée

ChatGPT: Le mode vocal avancé de OpenAI s’étend au Web !

Google Pixel Laptop : Un retour en force sur le marché des ordinateurs portables ?

Octoverse 2024 : Python détrône JavaScript sur GitHub !

GitHub Copilot : Multi-modèles, Xcode et nouvelles fonctionnalités pour les développeurs

Copilot Chat : GitHub intègre les modèles d’IA d’Anthropic et Google !

Samsung Health SDK : la boîte à outils ultime pour les développeurs d’applications santé

Bluesky : Le guide complet pour débuter et maîtriser l’alternative à X

Notion : Formulaires, e-mails et IA pour une productivité maximale !

Sky Follower Bridge : Retrouvez vos contacts X sur Bluesky !

ChatGPT Search : Découvrez les fonctionnalités qui révolutionnent la recherche en ligne

I/O 2024 : Imagen 3, la nouvelle ère de la génération d’images par IA chez Google

Imagen 3 disponible dans le AI Test Kitchen

Threads innove avec l’onglet Récent pour des recherches plus pertinentes

I/O 2024 : Google dévoile sa série Gemma 2, avec un modèle aux paramètres de 27B

The author Yohann Poiron

I/O 2024 : Imagen 3, la nouvelle ère de la génération d’images par IA chez Google

Imagen 3 disponible dans le AI Test Kitchen

The author Yohann Poiron

vous pourriez aussi aimer