Dans le paysage actuel du développement logiciel, l’interface de programmation d’applications (API) est devenue un pivot essentiel. OpenAI vient de renforcer significativement son API avec l’intégration de la nouvelle version améliorée de son modèle de langage, GPT-4 Turbo avec des fonctionnalités visuelles, désormais disponible pour le grand public.

Révélée initialement en novembre lors de la conférence des développeurs d’OpenAI, la version GPT-4 Turbo promet des performances accrues, une capacité de traitement élargie pouvant gérer jusqu’à 128 000 jetons — l’équivalent d’environ 300 pages de texte — et une meilleure accessibilité en termes de coût.

Majorly improved GPT-4 Turbo model available now in the API and rolling out in ChatGPT. https://t.co/HMihypFusV
— OpenAI (@OpenAI) April 9, 2024

Ce modèle étendu permet désormais l’analyse d’images par des appels API simples en format JSON, facilitant l’intégration dans les applications tierces pour des actions automatisées telles que l’envoi d’e-mails, la publication en ligne ou les achats. Cependant, OpenAI recommande la mise en place de flux de confirmation par les utilisateurs avant toute action ayant un impact réel, afin de renforcer la sécurité et la fiabilité des applications.

Cette unification des capacités de traitement de texte et d’image en une seule requête API simplifie le workflow des développeurs et optimise l’efficacité des applications. Parmi les utilisateurs de la première heure de GPT-4 Turbo avec Vision, on trouve Cognition, une startup innovante dont l’agent de codage autonome, Devin, génère automatiquement du code complet pour les utilisateurs.

Devin, built by @cognition_labs, is an AI software engineering assistant powered by GPT-4 Turbo that uses vision for a variety of coding tasks. pic.twitter.com/E1Svxe5fBu
— OpenAI Developers (@OpenAIDevs) April 9, 2024

De plus, l’application Healthify utilise ce modèle pour analyser les photos de repas des utilisateurs et fournir des recommandations nutritionnelles, tandis que la startup britannique TLDraw l’exploite pour transformer les dessins sur tableau blanc virtuel en sites web fonctionnels.

Make Real, built by @tldraw, lets users draw UI on a whiteboard and uses GPT-4 Turbo with Vision to generate a working website powered by real code. pic.twitter.com/RYlbmfeNRZ
— OpenAI Developers (@OpenAIDevs) April 9, 2024

GPT-4 Turbo avant GPT-5

Bien que GPT-4 Turbo ne surpasse pas certains des modèles plus récents dans les tests de performance, tels que Claude 3 Opus d’Anthropic ou Command R+ de Cohere, et même le Gemini Advanced de Google, son intégration étendue auprès des développeurs et des clients potentiels devrait continuer à renforcer la position d’OpenAI dans l’arène mondiale des Large Language Model en attendant la sortie de son prochain LLM.

Google Docs : Résumé automatique par IA avec Gemini, la productivité boostée

YouTube Premium : audio haute qualité à 256 kbps, une nouvelle option pour les abonnés

Chrome Canary : Gemini intégré avec une nouvelle icône, accès direct à l’IA

Xbox : l’intégration Steam révélée par erreur, l’avenir du gaming unifié ?

Test des Xiaomi OpenWear Stereo : Une alternative aux écouteurs intra-auriculaires ?

Test du Microsoft Surface Laptop 7 : Une surprenante renaissance avec le Snapdragon X Elite

Test du Xiaomi 14T Pro, le flagship killer qui n’a pas peur des grands

Test du XGIMI MoGo 3 Pro : Le projecteur portable qui a tout pour plaire

Apple : iPhone 17 et iPhone 18 en 3 nm, le passage au 2 nm repoussé à 2027 ?

CMF Phone (2) : un design revisité, un triple capteur photo et les premières fuites dévoilées

Les teasers officiels révèlent que les OPPO Pad 4 Pro et Watch X2 Mini sont destinés aux femmes

iPhone pliable : Apple trouve la solution pour un écran sans pli avec une charnière révolutionnaire

Nvidia : un ordinateur quantique IA pour dominer l’avenir, le NVAQC dévoilé

Gemini : transformez vos recherches en podcasts audio avec cette nouvelle fonctionnalité IA

Anthropic : Claude veut révolutionner l’IA avec le contrôle vocal des PC

iFixit lance un vérificateur de compatibilité pour faciliter vos réparations

Discord Social SDK : l’intégration gratuite des fonctionnalités sociales Discord dans les jeux vidéo

Claude Code : Des bugs critiques dès le lancement, les développeurs en colère

Gemini Code Assist : l’IA de Google pour coder devient gratuite et défie la concurrence !

GitHub Copilot : le mode agent révolutionne le développement avec l’IA !

Migrer de Google à Proton : e-mails, mots de passe, fichiers, le guide étape par étape

Connecter Android et Windows : toutes les solutions pour utiliser vos applis sur PC !

Time Machine : Le guide complet pour sauvegarder votre Mac

Que faire avec un Raspberry Pi ? 6 idées originales pour le réutiliser

OpenAI révolutionne l’API avec GPT-4 Turbo et Vision

GPT-4 Turbo avant GPT-5

Discord simplifie les interactions avec l’introduction des sondages natifs

Frame.io V4 : Réinventer la collaboration média dans le cloud

The author Yohann Poiron

OpenAI révolutionne l’API avec GPT-4 Turbo et Vision

GPT-4 Turbo avant GPT-5

The author Yohann Poiron

vous pourriez aussi aimer