Les services de transcription basés sur l’IA existent depuis un certain temps déjà, mais le passage aux réunions en ligne ces derniers temps les a presque rendus moins utiles. Cependant, de plus en plus d’entreprises reviennent aux réunions en personne, mais avec des protections en place, comme des masques et une distanciation physique. Cela peut rendre la transcription automatique plus difficile, obligeant certains à prendre des notes et à perdre le fil de la conversation.
Microsoft Garage développe depuis un certain temps déjà de nombreuses applications expérimentales. Le dernier projet de l’équipe tente toutefois de remédier à ce problème grâce à une IA apparemment magique, à condition que tous les participants à la réunion disposent d’un iPhone et que l’application Group Transcribe soit installée.
Pour être clair, Group Transcribe est conçu pour les réunions en présentiel, pas pour les réunions en ligne. Bien qu’elle puisse toujours être utilisée pour des réunions à distance ou virtuelles, son efficacité pourrait considérablement chuter. En effet, l’application exploite l’entrée audio collective de tous les smartphones connectés à une réunion pour créer une « transcription très précise » qui inclut également qui a dit quoi.
Cette exigence « en direct » alimente également les capacités de traduction en temps réel de Group Transcribe. Cela signifie que les participants peuvent parler confortablement dans leur propre langue et que les autres pourront suivre la traduction en direct.
Group Transcribe prend en charge plus de 80 langues, se vante Microsoft Garage, mais son pouvoir apparemment magique n’est pas sans coût.
Libérer la parole
Comme tout système de transcription et de traduction basé sur l’IA, Group Transcribe s’améliore et se développe en fonction des données qui lui sont fournies. Alors que Microsoft promet de ne pas stocker d’enregistrements audio ou de textes transcrits sur ses serveurs, l’équipe de recherche de Garage lance un appel aux utilisateurs pour qu’ils fassent don d’une partie de ces données afin de contribuer à l’amélioration du système. Heureusement, il s’agit d’une condition d’acceptation qui requiert l’accord de tous les participants.
Les enregistrements et les transcriptions seront « désidentifiés » et divisés en bribes qui seront ensuite distribuées aux examinateurs. Cela dit, Microsoft Garage indique clairement que des êtres humains seront effectivement impliqués dans le traitement de ces bribes d’informations, ce qui pourrait faire ressurgir les cauchemars des assistants vocaux et des tiers entrepreneurs il y a quelques années.
Si vous avez souvent du mal à comprendre ce que quelqu’un a dit dans une langue donnée, Group Transcribe vous aidera en vous montrant les transcriptions et les traductions en temps réel de vos réunions en personne.