Le directeur général de Microsoft AI, Mustafa Suleyman, a déclaré que tout le contenu de l’internet était gratuit pour l’entraînement des modèles d’IA, ce qui a suscité une levée de boucliers. Dans une interview accordée à CNBC, Suleyman a minimisé les inquiétudes concernant l’utilisation de la propriété intellectuelle par les entreprises spécialisées dans l’IA, affirmant que la pratique consistant à utiliser librement des contenus en ligne accessibles au public est établie depuis des années.
« Je pense qu’en ce qui concerne le contenu qui se trouve déjà sur le web ouvert, le contrat social de ce contenu depuis les années 90 est qu’il s’agit d’une utilisation équitable. Tout le monde peut le copier, le recréer, le reproduire », a-t-il déclaré. C’est ce que l’on appelle le « freeware », si l’on veut, et c’est ce que l’on a compris.
Le leader de la technologie a ajouté qu’à moins qu’un éditeur ou un organe de presse ne demande explicitement de ne pas « crawler ou scraper » son contenu autrement que pour l’indexer, les entreprises d’IA peuvent l’utiliser pour former des modèles d’IA.
Microsoft AI CEO Mustafa Suleyman: the social contract for content that is on the open web is that it’s « freeware » for training AI models pic.twitter.com/FN1xrqnJC0
— Tsarathustra (@tsarnick) June 26, 2024
Il a ajouté : « Il existe une catégorie distincte dans laquelle un site Web, un éditeur ou un organe de presse a explicitement demandé à ce que son contenu ne soit pas “scrapé” ou “crawlé” pour une raison autre que l’indexation, afin que d’autres personnes puissent trouver ce contenu. Il s’agit d’une zone grise, et je pense qu’elle sera examinée par les tribunaux ».
Le commentaire de Suleyman sur les limites juridiques floues de l’apprentissage des modèles d’IA se reflète dans les récentes actions en justice. À la suite de ses remarques, le Center for Investigative Reporting a intenté une action en justice contre OpenAI et son principal investisseur, Microsoft, alléguant l’utilisation non autorisée du contenu de l’organisation à but non lucratif sans permission ni compensation.
Les utilisateurs réagissent aux commentaires du PDG de Microsoft AI sur l’IA
Selon le registre, le vérificateur d’IA Copyleaks a constaté que près de 60 % des réponses fournies par ChatGPT-3.5 contenaient une forme ou une autre de contenu plagié, et que plus de 45 % contenaient un texte identique à un contenu préexistant.
Cette action en justice s’inscrit dans la lignée d’actions en justice analogues menées par le New York Times et environ 8 autres organisations médiatiques.
Plusieurs utilisateurs ont publié leurs réactions sur X, en désaccord avec le point de vue du PDG de Microsoft selon lequel le contenu disponible fait partie d’un « contrat social », libre d’être utilisé pour former des modèles d’intelligence artificielle.
Wrong, @mustafasuleyman. There has however been a ‘social contract since the 90’s’ that Microsoft makes bloatware. It SHOULD be freeware but now your company is brazenly stealing all of human expression by reducing it to ‘content’. Shame on you. https://t.co/lN9JjXNE3u
— Jörg Tittel (@newjorg) June 29, 2024
Ghouls. They’re getting rich from making plagiarism machines.
Microsoft’s AI boss thinks it’s perfectly OK to steal content if it’s on the open web / Mustafa Suleyman has a curious understanding of copyright law on the web.https://t.co/U56Isn9jGf
— Todd Vaziri (@tvaziri) June 29, 2024
L’un d’entre eux a déclaré : « Cela DEVRAIT être un logiciel gratuit, mais votre entreprise vole effrontément toute l’expression humaine en la réduisant à un “contenu” », tandis qu’un autre a déclaré que c’était l’équivalent d’une « machine à plagier ».