Alors que l’année a été dominée par les polémiques autour de Siri, l’un des succès de l’assistant vocal d’Apple — sa capacité à commencer à écouter lorsqu’il est invoqué avec « Hey Siri » — est le sujet de la dernière entrée dans le Machine Learning Journal, qui fait également allusion à de futures améliorations pour la fonctionnalité. Le blog explique comment les appareils iOS écoutent en permanence l’invite et indique les progrès de l’IA qui pourraient éliminer le besoin de Siri pour la formation initiale.

Dans « Personalized Hey Siri », l’équipe note que certains des plus grands défis de la fonctionnalité sont les activations accidentelles et les activations accidentellement manquées. Actuellement, Apple tente de prévenir ces problèmes en initiant Siri avec la voix du propriétaire de l’appareil, et demandant aux utilisateurs de former brièvement l’assistant avec cinq courtes phrases, qui créent un profil d’utilisateur stocké dans l’appareil. Siri ajoute ensuite tranquillement les 35 prochaines phrases « acceptées » de l’utilisateur pour améliorer le profil.

Ce qui est intéressant à propos du déclencheur « Hey Siri », c’est que le profil n’essaie pas seulement de faire correspondre une seule empreinte vocale avec les répétitions ultérieures de la même phrase. Au lieu de cela, le profil inclut finalement une version de base de la phrase avec 40 variations mathématiquement notées ; Siri ne se réveille que si un énoncé « Hey Siri » donné est égal ou supérieur au score moyen. L’appareil stocke également les enregistrements de ces 40 requêtes, ce qui permet de reconstruire le profil de l’utilisateur sans que ce dernier se perfectionne à chaque fois qu’Apple améliore le système avec une mise à jour logicielle.

À l’avenir, Apple s’attend à ce que Siri ne soit pas formé à l’avance — le profil d’utilisateur commencera vide, puis utilisera la permission de l’utilisateur pour se développer et se mettre à jour organiquement au fur et à mesure que d’autres demandes arriveront. L’entreprise travaille également sur les moyens d’éliminer les « faux déclenchements ». En utilisant un réseau neuronal profond, Apple croit qu’elle pourrait réduire le taux de fausse acceptation de 50 %, le taux de faux rejet (lorsque l’utilisateur dit « Hey Siri », mais que l’appareil ne répond pas) d’environ 40 %, et l’activation de Siri par une autre personne de près de 75 %.

Une prochaine annonce dans la WWDC 2018

L’autre astuce consiste à faire en sorte que Siri soit plus performant dans les grandes pièces réverbérantes et les environnements bruyants tels que les voitures ou les environnements extérieurs venteux. L’équipe d’Apple précise qu’elle recherche actuellement des moyens de traiter les environnements présentant des graves discordants avec les enregistrements Hey Siri existants du profil utilisateur.

Parce qu’Apple change continuellement Siri et ne signale pas nécessairement toutes les modifications, il n’est pas clair quand les améliorations mises en évidence ci-dessus seront mises en œuvre. Cela dit, la société souligne fréquemment les changements majeurs apportés à Siri lors de la conférence mondiale des développeurs de juin, et étant donné la quantité de discussions récentes sur les lacunes de Siri, nous nous attendons à entendre des annonces majeures dans un proche avenir.

Google Lens et Google Pay : Les achats des fêtes de fin d’année simplifiés !

Windows 365 Link : Le mini PC Cloud qui révolutionne l’espace de travail

Google Chat : Messages vocaux pour les comptes personnels, mais quel est son rôle ?

5 raisons pour lesquelles Bluesky est l’alternative idéale aux réseaux sociaux classiques

Test du Lenovo Yoga 9i (2024) : Le 2-en-1 premium se perfectionne avec la puce Intel Core Ultra

Test du Honor Magic V3 : Le smartphone pliable le plus fin du monde est arrivé !

Test du FlexiSpot E7 Pro : Le bureau debout qui allie robustesse, stabilité et design élégant

Test du Google Pixel 9 Pro XL, l’IA et l’autonomie révolutionnent le smartphone

ASUS lance les ROG Phone 9 et ROG Phone 9 Pro : Quel modèle choisir pour le gaming ?

Telegram : Mini-applications boostées, mais la confidentialité en question ?

Galaxy S25 : Davantage de RAM et IA renforcée, prix statiques ?

iPhone 17 Air : Ultra-fin et ultra-léger, une révolution design ?

Gemini Advanced : L’IA de Google s’adapte enfin à vos intérêts grâce à sa mémoire !

Teams : Interprétation en temps réel, transcriptions multilingues et résumés améliorés

Microsoft 365 Copilot : Actions, Agents SharePoint et nouveautés pour PowerPoint, Outlook et Excel

Clipchamp : L’édition vidéo révolutionnée par la transcription

Octoverse 2024 : Python détrône JavaScript sur GitHub !

GitHub Copilot : Multi-modèles, Xcode et nouvelles fonctionnalités pour les développeurs

Copilot Chat : GitHub intègre les modèles d’IA d’Anthropic et Google !

Samsung Health SDK : la boîte à outils ultime pour les développeurs d’applications santé

Bluesky : Le guide complet pour débuter et maîtriser l’alternative à X

Notion : Formulaires, e-mails et IA pour une productivité maximale !

Sky Follower Bridge : Retrouvez vos contacts X sur Bluesky !

ChatGPT Search : Découvrez les fonctionnalités qui révolutionnent la recherche en ligne

L’équipe « Hey Siri » d’Apple vient de dévoiler ce qui va suivre

Une prochaine annonce dans la WWDC 2018

Honor 10 : les spécifications fuite sur la TENAA avant le lancement

La mise à jour Windows 10 Redstone 4 lancée comme « April 2018 Update » ?

The author Yohann Poiron

L’équipe « Hey Siri » d’Apple vient de dévoiler ce qui va suivre

Une prochaine annonce dans la WWDC 2018

The author Yohann Poiron

vous pourriez aussi aimer