Anthropic a récemment annoncé la sortie de Claude 2, une version améliorée de son modèle d’IA. Le modèle mis à jour offre des réponses plus longues et de meilleures performances que son prédécesseur, Claude 1.3.
Les utilisateurs peuvent désormais accéder au modèle par l’intermédiaire de son API et d’un nouveau site Web bêta ouvert au public. Claude 2 est un concurrent de taille pour ChatGPT, en particulier pour les développeurs, en raison de sa capacité à traiter de grandes quantités de données et de ses fonctionnalités conviviales.
Qu’est-ce que Claude 2 ?
Claude 2 est un nouveau chatbot d’IA créé pour rivaliser avec ChatGPT et Bard. Il est doté d’un vaste modèle de langage et peut résumer des textes, rédiger des documents et aider à effectuer des tâches telles que le codage et les mathématiques. Il est disponible en version bêta pour le public, et des versions antérieures ont déjà été intégrées dans des produits d’entreprises comme Slack et Zoom.
« Nous avons procédé à des itérations pour améliorer la sécurité sous-jacente de Claude 2, afin qu’il soit plus inoffensif et plus difficile à inciter à produire des résultats offensants ou dangereux. Nous disposons d’une équipe d’évaluation interne qui évalue nos modèles sur un large ensemble représentatif d’invites nuisibles, en utilisant un test automatisé, tout en vérifiant régulièrement les résultats manuellement ».
Claude 2 a montré des améliorations significatives en codage, en mathématiques et en raisonnement. Avec une augmentation de 73,0 % à 76,5 %, Claude 2 a obtenu un score supérieur à celui de Claude 1.3 dans la section à choix multiples de l’examen du barreau. Il a également obtenu des résultats supérieurs au 90e percentile aux examens de lecture et d’écriture du GRE. Ces résultats démontrent l’amélioration de la précision du modèle et sa capacité à traiter des problèmes complexes.
Démonstration de Claude 2
- Claude 2 se distingue par sa capacité à traiter jusqu’à 100 000 jetons dans sa limite. Cette caractéristique permet aux utilisateurs de saisir de grandes quantités de données à traiter
- Le modèle prend en charge le téléchargement de documents de différents types, ce qui le rend polyvalent et convivial
- Claude 2 est actuellement disponible pour les utilisateurs aux États-Unis et au Royaume-Uni, mais il est également possible d’y accéder via leur API
- Le prix de Claude 2 est le même que celui du modèle précédent
- La vidéo ci-dessus illustre l’utilisation de Claude 2 en récupérant et en analysant les documents 10Q de Facebook, Apple et Google. Le modèle a été capable d’analyser rapidement plus de 200 pages de documents et de fournir un résumé des performances des entreprises
- L’interface de Claude 2 est conviviale, toutes les discussions étant visibles sur la page principale. Les utilisateurs peuvent sauvegarder leurs discussions et y revenir plus tard
- Le modèle peut également être utilisé pour analyser le code. La vidéo ci-dessus le démontre en téléchargeant un simple jeu de pierre-papier-ciseaux en Python et en demandant au modèle d’en expliquer le fonctionnement.
Une autre amélioration importante de Claude 2 est sa capacité à traiter jusqu’à 100 000 mots dans chaque invite. Cela lui permet de travailler avec une documentation technique étendue ou même des livres entiers. De plus, le modèle peut écrire des documents plus longs, allant de mémos à des histoires, en une seule fois.
Compétences en codage
Les compétences de Claude 2 en matière de codage ont également connu une amélioration significative, puisqu’il a obtenu 71,2 % au Codex HumanEval, un test de codage Python, contre 56,0 % auparavant. Au GSM8k, un ensemble de problèmes mathématiques d’école primaire, Claude 2 a obtenu un score de 88,0 %, contre 85,2 % auparavant. Ces résultats démontrent la capacité accrue du modèle à traiter des problèmes complexes de codage et de mathématiques.
Une caractéristique essentielle de Claude 2 est qu’il est conçu pour être plus inoffensif et moins susceptible de produire des résultats offensants ou dangereux. Par rapport à Claude 1.3, le modèle s’est avéré deux fois plus performant pour donner des réponses inoffensives. Cette caractéristique fait de Claude 2 une option plus viable pour les entreprises qui exigent de leurs modèles d’IA des résultats sûrs et non offensifs.
Disponibilité de Claude 2
Claude 2 est actuellement disponible aux États-Unis et au Royaume-Uni, et il est prévu de l’étendre à l’ensemble du monde dans les mois à venir. En outre, des entreprises telles que Jasper, une plateforme d’IA générative, et Sourcegraph, une plateforme d’IA de code, ont déjà constaté que Claude 2 était bénéfique pour une variété de cas d’utilisation. Il s’agit notamment d’utilisations à long terme et à faible latence, et de réponses précises aux questions des utilisateurs.
Dans l’ensemble, les améliorations apportées à Claude 2 en font un outil plus puissant pour les entreprises et les particuliers. Sa précision accrue, sa capacité à traiter des problèmes complexes et sa conception inoffensive en font un atout précieux dans le monde de l’IA.