Cette semaine, la startup parisienne Mistral, qui avait levé le plus grand tour de table initial jamais réalisé en Europe il y a un an, marque son entrée dans le domaine du développement et de la programmation avec le lancement de Codestral-22B, son premier Large Language Model (LLM) centré sur le code.
Disponible dès aujourd’hui sous une licence non commerciale, Codestral-22B est un modèle d’IA générative de 22 milliards de paramètres, spécialisé dans les tâches de codage, de la génération à la complétion de code.
Codestral-22B, un modèle performant pour toutes les tâches de codage
Codestral-22B se distingue par une longueur de contexte de 32K, permettant aux développeurs d’écrire et d’interagir avec le code dans divers environnements et projets de codage.
Le modèle a été entraîné sur un ensemble de données couvrant plus de 80 langages de programmation, ce qui le rend adapté à une large gamme de tâches de codage, y compris la génération de code à partir de zéro, la complétion de fonctions de codage, l’écriture de tests et la complétion de code partiel grâce à un mécanisme de remplissage intermédiaire.
Les langages de programmation pris en charge incluent des langages populaires comme SQL, Python, Java, C et C++, ainsi que des langages plus spécifiques tels que Swift et Fortran.
Performances supérieures aux modèles existants
Mistral affirme que Codestral-22B dépasse déjà les précédents modèles conçus pour les tâches de codage, y compris CodeLlama 70B et Deepseek Coder 33B. Le modèle est utilisé par plusieurs partenaires de l’industrie, dont JetBrains, SourceGraph et LlamaIndex.
Sur RepoBench, conçu pour évaluer la complétion de code Python au niveau des dépôts à long terme, Codestral-22B a surpassé tous les trois modèles avec un score de précision de 34 %. De même, sur HumanEval pour évaluer la génération de code Python et CruxEval pour tester la prédiction de sortie Python, le modèle a devancé la concurrence avec des scores de 81,1 % et 51,3 %, respectivement. Il a également surpassé les modèles sur HumanEval pour Bash, Java et PHP.
Une option prometteuse pour les développeurs
Harrison Chase, PDG et co-fondateur de LangChain, a déclaré dans un communiqué : « D’après nos tests initiaux, c’est une excellente option pour les workflows de génération de code car il est rapide, a une fenêtre de contexte favorable, et la version instructive prend en charge l’utilisation d’outils. Nous avons testé avec LangGraph pour la génération de code autocorrective en utilisant l’outil instructif de Codestral pour la sortie, et cela a très bien fonctionné dès le départ ».
Comment commencer avec Codestral-22B ?
Mistral propose Codestral-22B sur Hugging Face sous sa propre licence non commerciale, permettant aux développeurs d’utiliser la technologie à des fins non commerciales, de test et de soutien à la recherche. Le modèle est également disponible via deux endpoints API : codestral.mistral.ai et api.mistral.ai.
Le premier est conçu pour les utilisateurs souhaitant utiliser les routes Instruct ou Fill-In-the-Middle de Codestral dans leur IDE, avec une clé API gérée au niveau personnel sans les limites habituelles de taux d’organisation, et est gratuit pendant une période bêta de 8 semaines. Le second est le endpoint habituel pour la recherche plus large, les requêtes par lots ou le développement d’applications tierces, avec des requêtes facturées par jeton.
Les développeurs intéressés peuvent également tester les capacités de Codestral-22B en discutant avec une version instruite du modèle sur Le Chat, l’interface conversationnelle gratuite de Mistral.
Le lancement de Codestral par Mistral offre aux chercheurs en entreprise une autre option notable pour accélérer le développement de logiciels. Cependant, il reste à voir comment le modèle se comportera face aux autres modèles centrés sur le code sur le marché, y compris le récemment introduit StarCoder2 ainsi que les offres d’OpenAI et d’Amazon.
Alors que la demande pour une génération de code efficace et intelligente ne cesse de croître, Codestral-22B offre une solution convaincante qui associe une technologie d’IA innovante à une facilité d’utilisation pratique. En adoptant ce modèle innovant, les développeurs peuvent rationaliser leurs flux de travail, améliorer leur productivité et ouvrir de nouvelles possibilités dans le paysage en constante évolution du développement logiciel. Voici d’autres articles sur les modèles d’IA de Mistral qui pourraient vous intéresser :