Dans le paysage actuel du développement logiciel, l’interface de programmation d’applications (API) est devenue un pivot essentiel. OpenAI vient de renforcer significativement son API avec l’intégration de la nouvelle version améliorée de son modèle de langage, GPT-4 Turbo avec des fonctionnalités visuelles, désormais disponible pour le grand public.
Révélée initialement en novembre lors de la conférence des développeurs d’OpenAI, la version GPT-4 Turbo promet des performances accrues, une capacité de traitement élargie pouvant gérer jusqu’à 128 000 jetons — l’équivalent d’environ 300 pages de texte — et une meilleure accessibilité en termes de coût.
Majorly improved GPT-4 Turbo model available now in the API and rolling out in ChatGPT. https://t.co/HMihypFusV
— OpenAI (@OpenAI) April 9, 2024
Ce modèle étendu permet désormais l’analyse d’images par des appels API simples en format JSON, facilitant l’intégration dans les applications tierces pour des actions automatisées telles que l’envoi d’e-mails, la publication en ligne ou les achats. Cependant, OpenAI recommande la mise en place de flux de confirmation par les utilisateurs avant toute action ayant un impact réel, afin de renforcer la sécurité et la fiabilité des applications.
Cette unification des capacités de traitement de texte et d’image en une seule requête API simplifie le workflow des développeurs et optimise l’efficacité des applications. Parmi les utilisateurs de la première heure de GPT-4 Turbo avec Vision, on trouve Cognition, une startup innovante dont l’agent de codage autonome, Devin, génère automatiquement du code complet pour les utilisateurs.
Devin, built by @cognition_labs, is an AI software engineering assistant powered by GPT-4 Turbo that uses vision for a variety of coding tasks. pic.twitter.com/E1Svxe5fBu
— OpenAI Developers (@OpenAIDevs) April 9, 2024
De plus, l’application Healthify utilise ce modèle pour analyser les photos de repas des utilisateurs et fournir des recommandations nutritionnelles, tandis que la startup britannique TLDraw l’exploite pour transformer les dessins sur tableau blanc virtuel en sites web fonctionnels.
Make Real, built by @tldraw, lets users draw UI on a whiteboard and uses GPT-4 Turbo with Vision to generate a working website powered by real code. pic.twitter.com/RYlbmfeNRZ
— OpenAI Developers (@OpenAIDevs) April 9, 2024
GPT-4 Turbo avant GPT-5
Bien que GPT-4 Turbo ne surpasse pas certains des modèles plus récents dans les tests de performance, tels que Claude 3 Opus d’Anthropic ou Command R+ de Cohere, et même le Gemini Advanced de Google, son intégration étendue auprès des développeurs et des clients potentiels devrait continuer à renforcer la position d’OpenAI dans l’arène mondiale des Large Language Model en attendant la sortie de son prochain LLM.