Google continue de repousser les limites de la création visuelle avec son nouvel outil d’intelligence artificielle, Whisk, basé sur son dernier modèle de génération d’images, Imagen 3. Contrairement aux générateurs d’images traditionnels reposant uniquement sur des descriptions textuelles, Whisk permet de créer des visuels en utilisant des images existantes comme base.
Actuellement en phase expérimentale, Whisk se concentre sur une exploration visuelle rapide plutôt que sur des modifications pixel-parfaites.
Dès l’ouverture de Whisk, l’outil guide les utilisateurs à travers un écran d’accueil détaillant son fonctionnement, suivi d’options pour s’inscrire aux mises à jour et consulter la politique de confidentialité. Une fois cette étape franchie, l’utilisateur accède à l’interface principale. Google propose plusieurs styles d’images prédéfinis, comme des peluches, des pin’s émaillés et des stickers pour aider les utilisateurs à démarrer.
L’un des points forts de Whisk est la possibilité de télécharger une image personnelle pour servir de point de départ. Par exemple, en téléchargeant une photo d’une montre connectée, l’outil peut combiner cette image avec un style, tel qu’une peluche, pour générer un résultat unique. Bien que l’outil puisse parfois avoir des ratés, Google a prévu un espace de bibliothèque intégré, appelé Ma bibliothèque, où toutes les créations sont enregistrées.
Même les images générées en arrière-plan y sont sauvegardées, permettant de ne rien perdre, même en cas d’erreur.
Ajout de texte pour plus de créativité
En complément des images, Whisk offre un champ de texte pour affiner ou orienter la génération. Par exemple, après avoir généré des créatures mythiques en peluches, l’ajout de la commande texte « le personnage mange une glace » permet d’obtenir instantanément des images correspondantes. L’option Trouver l’inspiration propose aussi des suggestions pour guider les utilisateurs en manque d’idées.
Whisk inclut une bibliothèque intégrée où les utilisateurs peuvent consulter, télécharger ou supprimer leurs créations. Chaque image est accompagnée de son texte générateur, offrant la possibilité de copier les prompts pour une utilisation ultérieure dans d’autres outils.
Google met également l’accent sur la confidentialité : les utilisateurs peuvent désactiver l’option d’enregistrement automatique de leurs créations ou effacer toutes les données de la bibliothèque en un clic. Cette flexibilité fait de Whisk un outil adapté tant aux créateurs occasionnels qu’aux professionnels.
Whisk, un outil encore en développement
Google positionne Whisk comme une plateforme expérimentale. Bien qu’elle intègre des fonctionnalités textuelles pour compenser ses éventuelles limites, elle n’est pas encore prête pour des projets nécessitant un contrôle artistique rigoureux. L’outil se distingue toutefois par sa rapidité et son intuitivité, offrant une alternative intéressante aux générateurs d’images entièrement textuels, comme Microsoft Designer, qui se concentre sur des créations réalistes ou fantaisistes uniquement via des commandes textuelles.
Alors que Whisk est encore en phase de test, son intégration au sein de l’écosystème Google marque une avancée majeure pour la création d’images par IA. En combinant l’input visuel et textuel, cet outil ouvre la voie à une exploration plus libre et à une personnalisation accrue.
Que vous soyez un amateur curieux ou un créateur aguerri, Whisk représente une plateforme prometteuse pour expérimenter, tester et transformer vos idées en images captivantes. Une chose est certaine : avec l’ajout continu de nouvelles fonctionnalités, cet outil a le potentiel de rivaliser avec les meilleurs générateurs d’images actuels.