Le GitHub Copilot est censé faciliter les tâches quotidiennes des développeurs en complétant le code à l’aide d’une IA. Dans certains cas, le programme a toutefois copié du code protégé par des droits d’auteur. Microsoft pourrait bientôt devoir en répondre devant les tribunaux.
Afin de lutter contre d’éventuelles violations des droits d’auteur, l’avocat Joseph Saveri et l’avocat et développeur open source Matthew Butterick ont déposé une plainte collective contre Microsoft, GitHub, OpenAI et d’autres groupes.
@github copilot, with « public code » blocked, emits large chunks of my copyrighted code, with no attribution, no LGPL license. For example, the simple prompt « sparse matrix transpose, cs_ » produces my cs_transpose in CSparse. My code on left, github on right. Not OK. pic.twitter.com/sqpOThi8nf
— Tim Davis (@DocSparse) October 16, 2022
L’outil d’intelligence artificielle Copilot est basé sur un modèle d’OpenAI et aurait été entraîné à l’aide de milliards de lignes de code trouvées sur Internet. Les codes open source utilisés à cet effet n’étaient toutefois pas nécessairement approuvés à cette fin. Mi-octobre, Tim Davis avait par exemple constaté que Copilot avait émis du code protégé pour la transposition d’une matrice creuse.
Comme il s’agit d’une action collective autorisée aux États-Unis, d’autres développeurs concernés ont également la possibilité de participer à la procédure.
Dans la plainte déposée, GitHub Copilot est accusé d’avoir utilisé du code de Quake III. Le fait que le logiciel soit sous licence GPLv2 n’a pas été indiqué après la copie du contenu. En principe, le code source protégé par les droits d’auteur ne peut être repris que dans les conditions indiquées dans la licence. En outre, il est illégal de supprimer les métadonnées relatives aux auteurs.
Dans le contexte du GitHub Copilot, la question de savoir si le code produit par l’utilisation d’un outil d’intelligence artificielle peut être protégé par le droit d’auteur pourrait se poser à l’avenir. Actuellement, il y a une différence entre un logiciel écrit par soi-même et un logiciel généré par un autre programme.
C’est pourquoi certains juristes devraient encore se pencher sur la question dans les années à venir.