Google continue de faire évoluer sa suite d’outils IA Gemini avec une fonctionnalité spectaculaire intégrée à Gemini Advanced, son assistant IA premium. Grâce à Veo 2, le modèle IA de génération vidéo lancé fin 2024, il est désormais possible de générer des vidéos animées de 8 secondes à partir d’une simple description textuelle.
Ce nouvel outil ouvre un tout nouveau champ de créativité rapide, accessible et étonnamment réaliste.
Veo 2 dans Gemini : la vidéo IA accessible à tous
Avec Veo 2, les abonnés à Gemini Advanced peuvent désormais générer des clips au format 16:9, en 720p, directement depuis leur interface Gemini, que ce soit sur desktop ou mobile. Il suffit de sélectionner « Veo 2 » dans le menu déroulant des modèles (aux côtés de 2.0 Flash, 2.5 Pro, etc.) pour activer le mode création vidéo.
Gemini propose ensuite un champ de texte : décrivez-y la scène de votre choix. En quelques instants, votre description se transforme en vidéo MP4 animée, que vous pouvez :
- télécharger localement
- partager par lien public
- ou diffuser directement sur Facebook, LinkedIn, Reddit, X/Twitter
Une IA qui comprend les mouvements, la physique et le style visuel
Google affirme que Veo 2 comprend mieux que jamais :
- La physique du monde réel
- Les mouvements humains
- Les types d’objectifs photographiques
- Et la composition de scènes réalistes ou imaginaires
Cela permet de créer des vidéos qui semblent issues de vrais clips filmés. Chaque vidéo générée est marquée par la technologie SynthID, qui certifie qu’elle a été créée par une IA.
De la simple description à la création stylisée
Gemini se montre très performant, que vous donniez un prompt vague ou une description très détaillée. Voici deux exemples partagés :
- Prompt court : « Un groupe de K-pop joue une chanson sur scène dans un grand stade. Le public agite des lightsticks ». Résultat : un clip impressionnant, avec une chanteuse au style K-pop distinct, un stade bondé, et des sous-titres coréens en bas de l’écran, comme lors d’un live stream.
- Prompt détaillé : « Un homme et un chat marchent sur un chemin bordé de fermes abandonnées. Dans le ciel, des OVNI planent au-dessus des champs. ». Résultat : une scène immersive, où le chat se déplace naturellement et les OVNI apparaissent dans un jeu de caméra fluide entre les arbres.
Plus vous passez de temps à peaufiner votre description, plus le résultat est impressionnant. Mais Gemini sait aussi « compléter » avec créativité quand vous laissez des zones floues.
Et les images ? Whisk Animate pour aller plus loin
Pour ceux qui souhaitent aller au-delà du texte, Google propose également Whisk Animate, un outil complémentaire qui permet de transformer une image en vidéo animée de 8 secondes grâce à Veo 2.
Disponible via l’abonnement Google One AI Premium (20 euros/mois), Whisk Animate permet de donner vie à des images fixes de façon cinématographique. Bien que Veo 2 ne prenne pas encore en charge l’ajout d’images dans les prompts, Whisk permet de contourner cette limite.
Whisk est désormais disponible partout dans le monde pour les abonnés premium.
Avec cette avancée, Google donne un coup d’accélérateur à la création vidéo automatisée. Plus rapide que les outils classiques, mais plus stylisé et contrôlable que les générateurs simples, Gemini + Veo 2 s’annonce comme une solution puissante pour les créateurs, storytellers, communicants et curieux de l’IA.