Anthropic vient de dévoiler Claude 3.7 Sonnet, son tout premier modèle de raisonnement hybride, conçu pour résoudre des problèmes plus complexes et surpasser ses prédécesseurs dans des domaines clés comme les mathématiques et le codage.
Mais ce n’est pas tout. En plus de cette mise à jour, l’entreprise lance un aperçu limité de Claude Code, un nouvel outil d’IA « agentique » destiné aux développeurs. Contrairement aux solutions existantes, Claude Code ne se contente pas de générer du code, il peut rechercher et analyser du code, éditer des fichiers, exécuter des tests, gérer des commits GitHub et utiliser des outils en ligne de commande.
Claude 3.7 Sonnet : une IA plus puissante et plus polyvalente
Disponible dès aujourd’hui sur l’application Claude ainsi que via l’API d’Anthropic, Amazon Bedrock et Google Cloud Vertex AI, ce nouveau modèle offre des améliorations majeures tout en conservant le même coût que Claude 3,5 Sonnet :
- 3 dollars par million de tokens en entrée
- 15 dollars par million de tokens en sortie
Contrairement à OpenAI et d’autres concurrents qui développent des modèles spécialisés en raisonnement, Anthropic veut unifier toutes ces capacités au sein d’un seul modèle. Selon Dianne Penn, responsable de la recherche produit chez Anthropic, le raisonnement doit être une fonctionnalité inhérente à l’IA, et non une catégorie distincte.
Exemple concret : répondre à « Quelle heure est-il ? » ne doit pas nécessiter le même niveau de raisonnement que planifier un voyage de deux semaines en Italie en fonction de la météo de fin mars. Claude 3.7 Sonnet est conçu pour adapter son raisonnement en fonction de la complexité de la demande.
Des performances accrues en codage, finance et droit
- Codage avancé : Claude 3.7 Sonnet se démarque en « codage agentique », un concept où l’IA ne se limite pas à suggérer des lignes de code, mais participe activement à la conception, l’édition et l’optimisation des programmes.
- Finance et droit : Des gains de performance significatifs sont aussi notés dans ces secteurs où la compréhension fine du contexte et des réglementations est cruciale.
- Mise à jour des connaissances : Claude 3.7 Sonnet ne dispose toujours pas d’un accès en temps réel au Web, mais sa base de connaissances est à jour jusqu’en octobre 2024, le rendant plus pertinent que les précédentes versions.
- Contrôle précis des réponses : Les développeurs peuvent dicter la manière dont le modèle réfléchit et fixer une durée maximale pour obtenir une réponse. Par exemple, si une réponse ne doit pas dépasser 200 millisecondes, ils peuvent en faire une contrainte produit.
Claude Code : un assistant IA qui va plus loin que les autres
Avec Claude Code, Anthropic pousse l’IA générative encore plus loin. Ce nouvel outil permet aux développeurs de :
- Éditer et optimiser du code en continu
- Créer et exécuter des tests automatisés
- Interagir directement avec GitHub pour gérer commits et push
- Utiliser des commandes terminal pour exécuter des scripts et analyser des fichiers
En interne, les ingénieurs d’Anthropic ont utilisé Claude Code pour concevoir des sites Web, des jeux interactifs et même passer 45 minutes à ajuster des séries de tests en continu.
L’une des méthodes les plus originales pour tester Claude 3.7 Sonnet a été de lui faire jouer à Pokémon en liant son API à un schéma de contrôle. Résultat ? Claude 3,5 Sonnet ne parvenait pas à quitter Bourg Palette, tandis que Claude 3.7 a réussi à vaincre plusieurs champions d’arène.
Une course à l’IA qui s’accélère
Après la récente présentation de Grok-3 par Elon Musk, il est clair que la compétition dans le domaine de l’IA s’intensifie. Cependant, avec Claude 3.7 Sonnet, Anthropic semble reprendre la tête en misant sur une IA plus complète, plus flexible et mieux intégrée.
L’avenir de l’IA se dirige-t-il vers des modèles uniques capables de tout faire ? Claude 3.7 Sonnet laisse penser que oui.