ChatGPT est l’un des chatbots d’IA générative les plus populaires (si ce n’est le plus populaire), et son modèle de langage GPT sous-jacent alimente de nombreux autres services. L’entreprise anciennement connue sous le nom de Facebook, Meta, s’est maintenant associée à Microsoft pour créer une alternative : Llama 2.
Oui, vous avez bien lu ! Meta a collaboré avec Microsoft pour faire une incursion dans le secteur commercial de l’IA. Avec cette entrée dans le secteur commercial de l’IA, Meta vise à affronter Bard de Google, Bing AI de Microsoft et ChatGPT d’OpenAI, les grands noms de cet espace.
Llama a été initialement publié en février 2023 en tant que Large Language Model, mais contrairement au modèle GPT qui alimente ChatGPT et Bing Chat, il n’a pas été conçu comme un chatbot à usage général. Au contraire, il était fourni sous une licence non commerciale et destiné à des fins de recherche, telles que l’analyse d’ensembles de données, pour des groupes tels que les universités et les ONG. Au moins une version du modèle pouvait également fonctionner sans puissant serveur — après avoir été entraîné, le modèle LLaMA-13B pouvait fonctionner avec un seul GPU NVIDIA Tesla V100 que l’on retrouve dans un datacenter. Cependant, le modèle Llama a fait l’objet d’une fuite en ligne une semaine après sa présentation. Plus récemment, il a fait l’objet d’un procès intenté par Sarah Silverman et deux autres auteurs, qui affirment que Llama et ChatGPT d’OpenAI utilisent leurs livres protégés par des droits d’auteur comme données d’entraînement sans leur autorisation.
Meta vient d’introduire Llama 2, qui est disponible gratuitement pour la recherche et l’utilisation commerciale, et qui est également open source. Les modèles GPT-3.5 et GPT-4 d’OpenAI ne sont ni gratuits ni libres. Comme la version originale, ils sont conçus pour être entraînés sur des ensembles de données personnalisés, tels que des bases de données de recherche ou de la documentation logicielle.
Le mot d’ordre le plus important concernant la sortie de Llama 2 est « open source ». Cela signifie que le code source et les paramètres de Llama 2 sont rendus publics (uniquement pour les chercheurs et les entreprises partenaires pour le moment). Meta pense qu’en rendant son modèle de langage large (LLM) open source, les entreprises, les startups, les entrepreneurs et les chercheurs peuvent créer des avancées et des percées évolutives pilotées par des machines. Cela permettra également aux développeurs et aux chercheurs d’améliorer encore le modèle d’IA et de corriger les vulnérabilités au fur et à mesure qu’elles apparaissent, en temps réel.
Un partenariat avec Microsoft
Meta s’est également associé à Microsoft pour faciliter le déploiement de Llama 2 sur les serveurs.
Meta a déclaré dans son annonce : « Nous sommes maintenant prêts à ouvrir la source de la prochaine version de Llama 2 et à la rendre disponible gratuitement pour la recherche et l’utilisation commerciale. Nous incluons les poids du modèle et le code de départ pour le modèle pré-entraîné et les versions conversationnelles affinées également. » La documentation explique : « Les modèles pré-entraînés de Llama 2 sont entraînés sur 2 billions de tokens et ont une longueur de contexte deux fois supérieure à celle de Llama 1. Ses modèles affinés ont été entraînés sur plus d’un million d’annotations humaines. Llama 2 a été entraîné sur des sources de données en ligne accessibles au public. Le modèle affiné, Llama-2-chat, exploite des ensembles de données d’instruction accessibles au public et plus d’un million d’annotations humaines ».
Il n’existe pas encore de chatbot Llama 2, mais il se peut que vous utilisiez dans un proche avenir une application ou un outil d’IA utilisant Llama.