Lors de la conférence AWS re:Invent 2024, Amazon Web Services (AWS) a dévoilé des mises à jour majeures pour sa plateforme Bedrock, destinées à aider les entreprises à développer des modèles d’IA personnalisés et précis.
Parmi ces innovations, on trouve Amazon Bedrock Model Distillation, une méthode pour former des modèles plus compacts à partir de modèles volumineux, et Automated Reasoning Checks, un outil visant à réduire les erreurs factuelles dans les réponses générées par l’IA.
Amazon Bedrock Model Distillation : des modèles plus petits, mais plus intelligents
Avec Bedrock Model Distillation, AWS propose une méthode permettant de transférer les connaissances des modèles d’IA de grande taille, comme Llama 3.1 de Meta ou Claude d’Anthropic, vers des modèles plus petits et rapides, mieux adaptés aux charges de travail spécifiques des entreprises.
Pourquoi cette méthode est-elle cruciale ?
- Modèles volumineux : Bien qu’ils soient riches en connaissances, ces modèles sont souvent trop lents et gourmands en ressources pour des cas d’usage nécessitant des réponses rapides.
- Modèles compacts : Ces derniers offrent une vitesse accrue, mais leur capacité de traitement reste souvent limitée.
La distillation des modèles permet de conserver les avantages des modèles volumineux tout en profitant de la rapidité des modèles compacts. Voici comment cela fonctionne avec Bedrock :
- Choix du modèle : Sélectionnez un modèle volumineux, comme un Llama 3.1 à 405 milliards de paramètres.
- Modèle cible : Optez pour un modèle plus petit de la même famille.
- Optimisation automatique : Utilisez des prompts pour transférer les connaissances et affiner les performances du modèle compact. Bedrock génère automatiquement des données supplémentaires pour améliorer cette distillation.
Actuellement, cette méthode est compatible avec les modèles de Meta, Anthropic et Amazon. AWS mise sur cette approche pour simplifier un processus souvent complexe et réservé aux experts en apprentissage automatique.
Automated Reasoning Checks : un bouclier contre les hallucinations IA
Même les modèles IA les plus précis peuvent générer des erreurs factuelles. Pour remédier à cela, AWS a introduit Automated Reasoning Checks, un outil intégré aux Guardrails Bedrock conçu pour valider la précision des réponses de manière logique et mathématique.
Fonctionnement :
- Validation logique : L’outil vérifie si les réponses respectent les règles et les données fournies par l’utilisateur.
- Création de règles sur mesure : Les entreprises peuvent importer leurs données, et Bedrock établit des règles spécifiques pour guider les réponses du modèle.
- Correction des erreurs : Si une réponse générée est incorrecte, Automated Reasoning propose une solution alternative.
Matt Garman, PDG d’AWS, a souligné que cet outil renforce la fiabilité des modèles d’IA, les rendant adaptés à des domaines critiques comme le droit, la finance ou la santé.
Un équilibre entre rapidité et précision
Les entreprises recherchent de plus en plus des modèles capables de répondre rapidement tout en étant adaptés à leurs besoins spécifiques. Grâce à Model Distillation, elles peuvent former des modèles sur mesure, et avec Automated Reasoning Checks, elles s’assurent que ces modèles offrent des résultats fiables.
AWS ne fait pas ses premiers pas dans ce domaine. Depuis 2020, l’entreprise travaille sur des méthodes de distillation de modèles. Meta, Nvidia et d’autres acteurs ont également adopté ces techniques pour optimiser leurs modèles, comme le Llama 3.1-Minitron 4B de Nvidia, un modèle compact surpassant ses concurrents de taille similaire.
En intégrant ces capacités à Bedrock, AWS confirme son rôle de leader dans les solutions d’IA accessibles aux entreprises.
Les nouvelles fonctionnalités de Model Distillation et Automated Reasoning Checks témoignent de l’engagement d’AWS envers une IA responsable, centrée sur la précision et l’efficacité. Actuellement disponibles en aperçu, ces outils devraient s’enrichir avec les retours des premiers utilisateurs, consolidant ainsi la position d’AWS comme une référence dans le développement d’IA personnalisée pour les entreprises du monde entier.