En octobre 2023, des chercheurs d’Apple et de l’université de Columbia ont publié, sans coup de projecteur, un LLM multimodal open source, appelé Ferret. À l’époque, la publication — qui comprenait le code et les poids, mais pour un usage de recherche uniquement, sans licence commerciale — n’a pas suscité beaucoup d’intérêt. Mais aujourd’hui, cela pourrait changer : les modèles open source de Mistral ayant récemment fait la une des journaux et le modèle Gemini de Google arrivant sur le Pixel Pro et éventuellement sur Android, on parle de plus en plus du potentiel des LLM locaux pour alimenter de petits appareils.
Cette discussion s’est intensifiée récemment parce qu’Apple a annoncé qu’elle avait fait une percée clé dans le déploiement des LLM sur les iPhone : l’entreprise a publié deux nouveaux documents de recherche présentant de nouvelles techniques pour les avatars 3D et l’inférence efficace des modèles de langage. Ces avancées ont été saluées comme pouvant permettre des expériences visuelles plus immersives et l’exécution de systèmes d’IA complexes sur des appareils grand public tels que l’iPhone et l’iPad.
De nombreux membres de la communauté de l’IA qui ont remarqué tardivement la sortie de Ferret se sont réjouis de l’entrée inattendue d’Apple dans le paysage du LLM open source, d’autant plus qu’Apple est traditionnellement connu pour être un « jardin clos ».
Il y a quelques jours, Bart de Witte, qui dirige une association européenne à but non lucratif axée sur l’IA open source en médecine, a publié un message sur X : « J’ai en quelque sorte manqué cela », a-t-il écrit. « Apple a rejoint la communauté de l’IA open source en octobre. L’introduction de Ferret témoigne de l’engagement d’Apple en faveur d’une recherche sur l’IA ayant un impact, consolidant ainsi sa place de leader dans l’espace de l’IA multimodale… ps : J’attends avec impatience le jour où les Local Large Language Models (LLLM) fonctionneront sur mon iPhone en tant que service intégré à un iOS repensé ».
I somehow missed this. @Apple joined the open source AI community in October. Ferret’s introduction is a testament to Apple’s commitment to impactful AI research, solidifying its place as a leader in the multimodal AI space. Way to go @Apple – ps: I’m looking forward to the day… https://t.co/Pi1kQrsVvx
— Bart de Witte (@OpenMedFuture) December 23, 2023
Le blogueur technologique Ben Dickson a quant à lui écrit sur LinkedIn : « Quel est le développement de l’IA en 2023 que vous attendiez le moins ? Pour moi, c’est Apple qui a publié des LLM open source (bien qu’avec une licence non commerciale) ». Apple, ajoute-t-il, « a longtemps été le parangon des systèmes fermés, du développement en jardin clos, du secret, des accords de confidentialité à toute épreuve, de la divulgation de zéro détail et du brevetage de la moindre parcelle de ses produits ».
Un changement pour Apple
Mais rétrospectivement, poursuit-il, « il est logique pour Apple (comme pour Meta) d’entrer sur le marché du LLM avec des modèles open source. Pour rivaliser avec des modèles comme ChatGPT, il faut être un hyperscaler ou être en partenariat avec un hyperscaler. Apple a peut-être beaucoup de ressources, mais son infrastructure n’est pas conçue pour servir les LLM à grande échelle. L’alternative serait de devenir dépendant d’un fournisseur de cloud comme Microsoft ou Google (deux ennemis acharnés) ou de commencer à publier ses propres modèles open source, à la manière de Meta ».
Il est intéressant de noter que les nouvelles concernant les développements de machine learning locaux et open source d’Apple surviennent alors qu’Anthropic et OpenAI seraient en train de négocier de nouvelles levées de fonds massives pour leurs efforts de développement LLM propriétaires. Reuters a rapporté mercredi que Anthropic est en discussion pour lever 750 millions de dollars auprès de Menlo Ventures, tandis que Bloomberg a rapporté hier qu’OpenAI « est en discussions préliminaires pour lever un nouveau cycle de financement à une valeur égale ou supérieure à 100 milliards de dollars ».