fermer
Intelligence Artificielle

Google Gemini : des podcasts immersifs pour consommer vos documents

Google Gemini : des podcasts immersifs pour consommer vos documents
Google Gemini : des podcasts immersifs pour consommer vos documents

Dans un monde où les podcasts sont omniprésents, Google franchit une nouvelle étape avec Audio Overviews, une fonctionnalité novatrice de son IA Gemini qui transforme vos documents en véritables émissions audio.

Audio Overviews : deux hôtes IA pour résumer vos documents

Plutôt que de proposer un simple résumé texte, Audio Overviews génère un fichier audio simulant une conversation entre deux hôtes IA discutant du contenu de votre document. Cette fonctionnalité, initialement lancée dans l’application de prise de notes NotebookLM, permet une expérience immersive et naturelle. Les deux hôtes échangent comme s’ils animaient un vrai podcast, posant des questions et développant les points clés du sujet abordé.

Screen 2025 03 31 at 13.49.48

La durée des podcasts varie selon la taille du document, allant de 5 à 15 minutes. Un simple PDF d’un planning de ramassage des déchets peut donner lieu à un épisode de 5 minutes, tandis qu’un manuel technique de 146 pages produira un podcast bien plus long et détaillé.

Quels fichiers peut-on utiliser ?

Gemini prend en charge une large variété de formats, notamment les documents texte (PDF, DOCX, TXT), les présentations (PPTX, Google Slides) ou encore les fichiers de code source. Les utilisateurs abonnés à Gemini Advanced peuvent aussi uploader des fichiers HTML, Google Sheets, et plus encore.

Il est même possible de créer un Audio Overview à partir d’un rapport Deep Research, une autre fonctionnalité de Gemini qui effectue une recherche approfondie sur un sujet donné. Une fois le rapport généré, vous pouvez le transformer en podcast pour le consommer de manière plus agréable et synthétique.

Comment générer un « Audio Overview » ?

Pour créer un « Audio Overview » dans Gemini, suivez ces étapes :

  1. Allez sur gemini.google.com
  2. Importer le document : Cliquez sur l’icône « + » dans l’application Gemini pour télécharger le fichier souhaité. Les formats pris en charge incluent les documents texte, les présentations Google Slides, les fichiers PDF, entre autres.
  3. Générer l’aperçu audio : Une fois le document importé, une suggestion « Generate Audio Overview » apparaîtra au-dessus de la zone de saisie. Cliquez dessus pour lancer la création du podcast. Si cette option n’apparaît pas, vous pouvez simplement demander à Gemini de générer un « Audio Overview » du document.

Screen 2025 03 31 at 13.43.34

Note : Assurez-vous d’avoir réglé le langage de votre compte Google à “Anglais”. 

Des résultats bluffants

Les voix générées sont surprenamment naturelles, imitant même les interruptions ou les échanges spontanés. Les tests montrent une bonne capacité à extraire les points essentiels et à les expliquer de manière accessible. Par exemple, un manuel d’appareil photo Canon EOS a été transformé en discussion passionnée sur l’autofocus par suivi du regard. Même un scénario non publié a été résumé avec humour et clarté — bien qu’un élément clé du récit ait été omis.

Audio Overviews n’est pas juste une démonstration technologique : c’est un outil réellement utile. Pour ceux qui préfèrent écouter plutôt que lire, ou qui veulent optimiser leur temps (en marchant, en conduisant…), ce format offre un nouveau moyen d’accéder à l’information.

Google envisage également d’étendre cette fonctionnalité aux pages web, bien qu’il faille actuellement copier le contenu ou enregistrer la page en PDF pour en générer un podcast.

Google bouscule les codes du résumé traditionnel avec Audio Overviews, transformant vos documents en podcasts accessibles et engageants. Bien que tout ne soit pas parfait, cette approche marque un tournant dans la manière dont nous consommons les contenus textuels.

🔊 Et si le futur du podcast, c’était… vous ?

Tags : Audio OverviewGeminiGoogle
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.