Dans une ère où l’intelligence artificielle (IA) transforme radicalement nos interactions avec la technologie, Apple vient de franchir un pas significatif avec le développement de MGIE (MLLM-Guided Image Editing).
En collaboration avec l’Université de Californie à Santa Barbara, cette innovation permet d’éditer des photos à l’aide de descriptions simples, marquant un tournant dans le domaine de la retouche d’image.
Le MGIE se distingue par sa capacité à interpréter des instructions textuelles pour effectuer des modifications complexes ou de base sur des images, telles que le recadrage, le redimensionnement, la symétrie, ou l’application de filtres, sans nécessiter de logiciel de retouche photo traditionnel.
Cet outil ouvre de nouvelles voies en permettant, par exemple, de transformer une pizza au pepperoni en une version plus saine simplement en saisissant le souhait de la rendre « plus saine » dans l’interface.
Ce modèle multimodal exploite deux fonctions distinctes : comprendre les prompts des utilisateurs et visualiser les modifications souhaitées. Ainsi, demander un ciel « plus bleu » se traduit automatiquement par une augmentation de la luminosité de la partie ciel de l’image. Les recherches derrière MGIE ont prouvé son efficacité, démontrant une performance améliorée tout en conservant une efficience compétitive, promettant un impact significatif sur les futures recherches en vision par ordinateur et en langage naturel.
La disponibilité de MGIE pour le grand public depuis GitHub et une démo Web sur Hugging Face Spaces témoigne de l’engagement d’Apple dans le domaine de l’IA et de la manipulation d’images digitales. Bien que la firme de Cupertino reste discrète sur ses plans futurs pour le modèle MGIE, cette initiative souligne sa volonté de s’inscrire dans l’évolution de l’intelligence artificielle.
Apple arrive dans l’IA
Comparé à d’autres outils comme DALL-E 3 d’OpenAI ou le modèle Firefly AI d’Adobe, qui offrent également des capacités d’édition basées sur l’IA, MGIE marque l’entrée d’Apple dans la course à l’innovation en IA. Avec des ambitions claires de renforcer l’intégration de l’IA dans ses dispositifs, comme l’a souligné Tim Cook, Apple confirme sa stratégie de tirer parti des capacités de l’IA, illustrée par le lancement de MLX, un framework d’apprentissage machine open source optimisé pour les puces Apple Silicon.
Cette avancée met en lumière l’approche d’Apple, qui, bien qu’étant moins présente dans l’espace de l’IA générative par rapport à des géants comme Microsoft, Meta ou Google, démontre un engagement profond envers le progrès de la technologie IA, promettant d’enrichir l’expérience utilisateur à travers ses innovations.