L’anticipation monte autour de Sora ! OpenAI s’apprête à révolutionner une fois de plus le monde de l’intelligence artificielle avec son générateur de texte-à-vidéo, nommé Sora.
Mira Murati, la directrice technique d’OpenAI, a annoncé lors d’une interview avec The Wall Street Journal que Sora serait accessible au grand public « cette année », soulignant que sa disponibilité pourrait être question de quelques mois. Initialement, OpenAI avait restreint l’accès à Sora à un groupe fermé de chercheurs et de créateurs, cherchant à déceler et rectifier les éventuelles failles avant un déploiement plus large.
L’enjeu de ce développement prudent réside dans la nécessité de surmonter divers défis techniques et éthiques, illustrés récemment par la controverse entourant l’IA Gemini de Google, qui a produit des images historiquement inexactes, provoquant l’indignation publique. Ces incidents soulignent l’importance cruciale de peaufiner ces technologies avant leur introduction généralisée.
Dévoilé pour la première fois en février, Sora a la capacité de créer des scènes hyper-réalistes à partir de simples prompts textuels. Initialement, cette technologie était réservée aux artistes visuels, designers et cinéastes. Néanmoins, des vidéos générées par Sora ont rapidement trouvé leur chemin sur diverses plateformes en ligne.
L’intention d’OpenAI est de ne pas seulement rendre Sora accessible à tous, mais aussi d’intégrer à terme une fonctionnalité audio pour enrichir davantage le réalisme des scènes générées. De plus, la société envisage de permettre aux utilisateurs de modifier le contenu des vidéos produites, une flexibilité nécessaire puisque les outils d’IA ne génèrent pas toujours des images fidèles à la réalité.
Un coût élevé
Concernant les données utilisées pour entraîner Sora, Murati est restée évasive, se limitant à mentionner que les données étaient issues de sources publiques ou sous licence, confirmant uniquement l’utilisation de contenus de Shutterstock, partenaire d’OpenAI.
Murati a également évoqué le coût élevé du fonctionnement de Sora, tout en assurant que l’objectif était de rendre l’outil financièrement accessible, analogue à DALL-E, le modèle de génération texte-image d’OpenAI.
À l’approche des élections présidentielles de 2024 aux États-Unis, le potentiel impact des outils d’IA générative sur la création de désinformation est un sujet de préoccupation croissante. À sa sortie, Sora devrait implémenter des restrictions analogues à celles de DALL-E, notamment l’impossibilité de produire des images de personnalités publiques, et intégrer un filigrane afin de différencier les créations de la réalité, malgré les limites que cela peut impliquer.