OpenAI a peut-être essayé de voler la vedette à Google avec la sortie du modèle GPT-4o ce lundi, mais le géant de la technologie Google riposte avec son propre modèle de vidéo générative appelé Veo. Avec l’annonce de Veo lors de sa conférence des développeurs I/O 2024, Google défie Sora d’OpenAI qui a été annoncé pour la première fois en février de cette année.
Veo possède « une compréhension avancée du langage naturel », selon le communiqué de presse de Google, ce qui permet au modèle de comprendre des termes cinématographiques tels que « timelapse » ou « prises de vue aériennes d’un paysage ». Google affirme que les vidéos qui en résultent sont « plus homogènes et plus cohérentes », décrivant des mouvements plus réalistes pour les personnes, les animaux et les objets tout au long des plans.
Demis Hassabis, directeur général de Google DeepMind, a déclaré lors d’une présentation à la presse lundi que les résultats vidéo pouvaient être affinés à l’aide de prompts supplémentaires et que Google étudiait d’autres fonctionnalités pour permettre à Veo de produire des story-boards et des scènes plus longues.
🎥Introducing Veo, our new generative video model from @GoogleDeepMind.
With just a text, image or video prompt, you can create and edit HQ videos over 60 seconds in different visual styles. Join the waitlist in Labs to try it out in our new experimental tool, VideoFX #GoogleIO pic.twitter.com/RnMsWu9s1q
—Google (@Google) May 14, 2024
La question qui se pose maintenant est la suivante : que peut faire Google Veo pour vous ? Sir Demis Hassabis, PDG de Google Deepmind, a annoncé que Veo était le modèle vidéo génératif le plus performant à ce jour. Il peut aider les utilisateurs à générer des vidéos de haute qualité (jusqu’à 1080p) à l’aide de prompts textuelles, d’images et de prompts vidéo.
De plus, Veo « vous permet de créer du contenu qui capture les nuances émotionnelles à travers les styles visuels et produit des effets cinématographiques saisissants », indique l’article de blog officiel.
Il faudra patienter pour tester Veo
Comme c’est souvent le cas avec les modèles d’IA, la plupart des personnes qui souhaitent essayer Veo devront attendre un peu. Alors que Sora n’a été mis à la disposition que de certains développeurs et utilisateurs en coulisses, Google permet aux utilisateurs de s’inscrire sur une liste d’attente pour essayer Veo. L’accès à Veo se fera via VideoFX, le nouvel outil expérimental de Google, à partir des États-Unis. Vous pouvez vous rendre sur ce lien pour vous inscrire sur la liste d’attente VideoFX. Certaines fonctionnalités de Veo seront également mises à la disposition de « créateurs sélectionnés dans les semaines à venir » dans le cadre d’un aperçu privé au sein de VideoFX. Par ailleurs, Google prévoit également d’ajouter certaines de ses fonctionnalités à YouTube Shorts « à l’avenir ».
Lors de la conférence Google I/O 2024, l’entreprise nous a donné un bref aperçu de l’outil VideoFX et de la manière dont il vous permettra de saisir un texte à gauche et de voir la vidéo générée à droite. Vous pouvez prolonger la vidéo générée jusqu’à 60 secondes. Cet outil expérimental comprend également un mode Storyboard pour « itérer scène par scène et ajouter de la musique à votre vidéo finale ». De cette manière, vous pouvez voir vos vidéos finales se construire étape par étape.
Outre Veo, Google a annoncé son nouveau modèle Imagen 3 pour la génération d’images et a étendu Gemini 1.5 Pro à 2 millions de fenêtres contextuelles lors de sa conférence.