Lorsque l’on parle d’outils d’intelligence artificielle (IA), il se peut que l’on fasse plus spécifiquement référence à l’IA générative, dont la popularité et l’utilisation explosent.
L’IA générative est un terme utilisé pour englober les modèles linguistiques d’apprentissage profond qui génèrent du texte, des images, des vidéos et d’autres contenus à l’aide de prompts externes. Ils utilisent les ensembles de données à partir desquels ils apprennent pour créer diverses formes de contenu, allant de courts poèmes à de longs articles.
Le thème de l’IA générative a été mis en avant avec la diffusion à grande échelle de l’outil ChatGPT d’OpenAI, qui a mis l’IA générative à la portée du grand public. S’il s’agit peut-être de la première forme d’IA générative avec laquelle de nombreuses personnes ont été en contact, ce n’est certainement pas la seule à être apparue sur le marché.
Il existe aujourd’hui des dizaines de façons différentes d’accéder à l’IA générative, presque toutes les grandes entreprises technologiques publiant leurs propres versions, qu’il s’agisse de Gemini de Google, de l’investissement massif de Microsoft dans OpenAI, de GitHub Copilot, et de bien d’autres encore.
Avant que l’IA générative ne devienne synonyme de chatbots, elle était également utilisée dans les statistiques. Il s’agit d’un outil extrêmement utile pour l’analyse des données numériques, capable de lire rapidement et d’identifier des modèles et des tendances. C’est la montée en puissance de l’apprentissage profond qui a permis d’utiliser la même technologie pour les images, la parole et d’autres types de données complexes.
Le tout premier type de cette nouvelle classe d’IA générative a été introduit en 2013, sous le nom d’auto-encodeurs variationnels (VAE). Ils ont été largement utilisés pour générer des images et des discours réalistes. Au fil du temps, les outils ont été affinés pour créer des images, des sons et des écrits toujours plus réalistes.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Comment fonctionne l’IA générative ?
La définition de l’IA générative signifie que l’outil transforme des données brutes (qui peuvent aller d’un message rapide à la lecture de l’intégralité d’une page Wikipédia) en données de sortie. L’élément d’apprentissage automatique signifie que l’IA apprend quel type de résultat serait le plus probable, sur la base des données auxquelles elle a accès. Elle ne peut pas vraiment créer quelque chose de nouveau ; la véritable créativité reste l’apanage des créatures vivantes.
Cependant, elle peut créer de nouveaux éléments de sortie inspirés ou analogues à ce qu’elle a appris, sans que ce soit une copie directe. En règle générale, un prompt est donné sous n’importe quel format, qu’il s’agisse d’un texte, d’une image, d’une vidéo, d’une page Web ou de toute autre entrée que le système d’IA a appris à traiter. Il utilise ensuite ses algorithmes d’IA internes pour créer un nouveau contenu en réponse au prompt, sur la base des modèles qu’il a appris.
Pour approfondir la technologie requise, les outils d’IA générative combinent généralement plusieurs algorithmes pour traiter le contenu. Les données fournies sont ensuite transformées en caractères bruts, par exemple en transformant les paragraphes en lettres de base, en ponctuation, en mots ou en images en éléments visuels distincts. Ces caractères de base sont ensuite codés sous forme de vecteurs, que l’IA peut utiliser pour créer de nouveaux résultats.
Les biais de l’IA générative
Il convient de noter, en expliquant l’IA générative, que ce processus d’apprentissage des modèles de langage peut exposer la possibilité d’enseigner des biais humains aux modèles d’IA. S’il existe des biais dans les données d’origine, qu’ils soient inconscients ou non, ces biais apparaîtront dans les résultats créés ultérieurement.
Dans le monde réel, cela s’est traduit par la création par l’IA d’images ou de textes contenant des identités ou des références inexactes. Pour ne citer qu’un exemple, Google a récemment dû fermer ses outils de génération d’images au sein de Gemini en raison d’inexactitudes historiques apparaissant dans ses résultats.
Is the United States a better place to live compared to Nazi Germany? Google Gemini says no. pic.twitter.com/kQTJMZW8a3
— The Rabbit Hole (@TheRabbitHole84) February 27, 2024
Critique de l’IA générative
Ce n’est pas la seule forme de critique adressée à l’IA générative. Des artistes de différentes disciplines se sont plaints que les modèles d’apprentissage profond « volent » l’art créé par l’homme. Après tout, comme nous l’avons vu plus haut, l’IA générative ne peut rien apprendre.
Les données utilisées pour « enseigner » les modèles d’IA proviennent généralement d’œuvres artistiques. Légalement, il doit s’agir d’œuvres d’art ouvertes au public, mais cela n’a pas empêché les gens de s’indigner du fait que des images d’IA et d’autres formes de résultats peuvent être créées instantanément, apparemment sur le dos d’artistes humains.
Comment générer des images d’IA ?
Si vous souhaitez vous essayer à la génération d’images d’IA, vous avez le choix entre de nombreux outils. De nombreux outils de conception graphique, dont Adobe, Pixlr et Canva, ont intégré l’IA générative dans leurs offres, mais certains outils spécialisés permettent également de faire le travail. Il s’agit notamment de :
Bien entendu, ces outils ne sont pas gratuits, et tous nécessitent un abonnement payant pour pouvoir être utilisés. Une fois que vous avez accès à l’outil de votre choix, vous pouvez commencer immédiatement. La plupart des outils d’IA générative ressemblent à un chatbot, avec une boîte de dialogue dans laquelle vous pouvez saisir votre message. Pour tirer le meilleur parti de votre outil, vous devez utiliser d’astucieux prompts, mais il convient de noter que le modèle apprendra littéralement au fur et à mesure qu’il vous connaîtra.
Vous pouvez lui demander de retoucher les images au fur et à mesure, de refaire la même image dans des styles différents ou de modifier des zones spécifiques de l’image. Chaque outil est différent en ce qui concerne le niveau des modifications que vous pouvez apporter, mais la plupart offrent une sorte d’outil qui vous permet de sélectionner des éléments individuels qui peuvent être modifiés dans différentes itérations.