L’industrie de la technologie assiste avec intérêt aux préparatifs d’OpenAI pour son événement de lundi, où la société pourrait dévoiler une avancée significative avec un nouveau modèle d’IA multimodal.

On assiste à des spéculations croissantes autour de OpenAI, la société derrière ChatGPT, qui pourrait révolutionner son offre avec un assistant numérique multimodal. Ce développement, contrairement aux rumeurs antérieures, ne pointerait pas vers un moteur de recherche classique, mais vers une innovation pouvant toujours remettre en question la suprématie de Google.

L’assistant multimodal envisagé serait capable de traiter divers types d’entrées, pas seulement du texte. Selon un rapport de The Information, ce modèle serait capable de reconnaître les objets et de comprendre la parole, offrant une interprétation plus rapide et plus précise des images et des sons que les modèles actuels de transcription et de synthèse vocale.

Cette capacité permettrait, par exemple, d’analyser des informations visuelles via une caméra et de fournir des réponses audibles, enrichissant l’interaction avec l’utilisateur. Imaginez pointer votre caméra vers un panneau dans une langue étrangère, demander à ChatGPT d’identifier et de traduire le texte, puis recevoir une réponse vocale.

Cette fonctionnalité ressemble à ce que proposent déjà des outils comme Google Lens et Google Assistant, et même le récent Google Gemini. Néanmoins, la promesse d’OpenAI semble intégrer ces capacités dans une interface unique, renforçant l’efficacité et l’accessibilité.

Rendez-vous ce soir à 19 heures pour les annonces OpenAI

Les sources anonymes citées par The Information soulignent que cette IA pourrait non seulement améliorer l’efficacité des agents de service client en analysant l’intonation ou le sarcasme des appelants, mais également aider les étudiants avec les mathématiques ou traduire des panneaux en temps réel. Bien que le nouveau modèle puisse surpasser GPT-4 Turbo dans certains types de réponses, il reste sujet à l’erreur, parfois avec une grande assurance.

Ce lundi, lors de l’événement prévu, il est probable que l’entreprise dévoile un modèle GPT amélioré, bien que ce ne soit pas le GPT-5 tant attendu, attendu seulement pour fin 2024.

We’ll be streaming live on https://t.co/OcO6MLUYGH at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.

— OpenAI (@OpenAI) May 10, 2024

Le timing de cet événement est stratégique, se déroulant juste avant la Google I/O, où Google devrait révéler ses propres avancées en IA. Ce rendez-vous d’OpenAI, fixé ce lundi 13 mai à 19 heures, heure de Paris, pourrait non seulement ébranler la dominance de Google mais aussi ajuster les attentes du marché sur les capacités évolutives de l’IA en interaction directe avec les utilisateurs.

Amis Facebook : Meta retrouve ses origines avec le retour de l’onglet Amis

YouTube Premium : Partagez des vidéos sans pub avec vos proches, la nouvelle option qui pourrait séduire

Nintendo Switch 2 : Des jeux exclusifs et des « Switch 2 Edition » en approche

Instagram ajoute la lecture 2x aux Reels pour concurrencer TikTok

Test des Huawei FreeBuds Pro 4 : Son haute-fidélité à un prix abordable !

Test des Xiaomi OpenWear Stereo : Une alternative aux écouteurs intra-auriculaires ?

Test du Microsoft Surface Laptop 7 : Une surprenante renaissance avec le Snapdragon X Elite

Test du Xiaomi 14T Pro, le flagship killer qui n’a pas peur des grands

Gemini : l’IA pourrait bientôt répondre à vos appels téléphoniques sur Wear OS

Le Pixel 9a arrivera en Europe le 14 avril !

WhatsApp : bientôt votre application par défaut pour les appels et messages sur iPhone

Huawei : résultats financiers 2024 records, l’entreprise dépasse les attentes après les sanctions

Huawei : Un ordinateur hybride PC/tablette/smartphone en développement, le futur de l’informatique ?

OpenAI Academy : Une plateforme éducative gratuite pour tous, du débutant à l’expert IA

ChatGPT suspend la génération d’images après une popularité inattendue de GPT-4o et du style Ghibli

Microsoft 365 Copilot : Researcher et Analyst, deux agents IA pour une automatisation avancée

Qu’est-ce que le Vibe Coding et pourquoi il est risqué ?

Vibe Coding : L’IA peut-elle vraiment remplacer les développeurs ? Les dangers du « code à l’aveugle »

Discord Social SDK : l’intégration gratuite des fonctionnalités sociales Discord dans les jeux vidéo

Claude Code : Des bugs critiques dès le lancement, les développeurs en colère

Migrer de Google à Proton : e-mails, mots de passe, fichiers, le guide étape par étape

Connecter Android et Windows : toutes les solutions pour utiliser vos applis sur PC !

Time Machine : Le guide complet pour sauvegarder votre Mac

Que faire avec un Raspberry Pi ? 6 idées originales pour le réutiliser

OpenAI prévoit de lancer un assistant numérique multimodal révolutionnaire

Rendez-vous ce soir à 19 heures pour les annonces OpenAI

L’iPhone 16 Pro promet une luminosité améliorée et des innovations majeures

Lancement repoussé de la GoPro Max 2 face à la conquête de Insta360

The author Yohann Poiron

OpenAI prévoit de lancer un assistant numérique multimodal révolutionnaire

Rendez-vous ce soir à 19 heures pour les annonces OpenAI

The author Yohann Poiron

vous pourriez aussi aimer