Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Problème 1769

Incidents associés

Incident 2405 Rapports
GitHub Copilot, Copyright Infringement and Open Source Licensing

Loading...
Analyser les implications juridiques de GitHub Copilot
fossa.com · 2021

Le monde du génie logiciel est en effervescence ces derniers jours après la sortie de GitHub Copilot — un assistant de programmation basé sur l'apprentissage automatique. Copilot vise à aider les développeurs à travailler plus rapidement et plus efficacement en suggérant automatiquement des lignes de code et/ou des fonctions entières.

Cependant, la question de comment GitHub Copilot génère ces suggestions a fait l'objet d'une certaine controverse. En bref, le modèle d'apprentissage automatique de Copilot a été formé sur du code public. Cela soulève deux questions :

  1. GitHub a-t-il besoin de l'autorisation du propriétaire des droits d'auteur du code pour former Copilot sur ce code ?
  2. Les suggestions de Copilot sont basées sur une quantité massive de code public, dont certains sont couverts par de fortes licences de copyleft. L'utilisation de Copilot comptera-t-elle comme la création d'une œuvre dérivée du code original sous licence copyleft ?

Pour répondre à ces questions (et placer Copilot dans le contexte juridique approprié), nous nous sommes tournés vers Kate Downing, une avocate spécialisée en propriété intellectuelle qui aide les éditeurs de logiciels à naviguer dans des domaines tels que la conformité open source.

GitHub Copilot commet-il une violation du droit d'auteur ?


Avant d'explorer les ramifications de la conformité des licences de GitHub Copilot, nous allons commencer par un sujet qui va au cœur même de savoir si GitHub peut former Copilot sur du code accessible au public sans l'autorisation du détenteur des droits d'auteur.

Selon Downing, la réponse dépend dans une certaine mesure de où ce code est hébergé. Si c'est sur GitHub, il n'y aurait très clairement pas de violation du droit d'auteur.

"Si vous consultez les [Conditions d'utilisation de GitHub] (https://docs.github.com/en/github/site-policy/github-terms-of-service), quelle que soit la licence que vous utilisez, vous donnez à GitHub le droit d'héberger votre code et d'utiliser votre code pour améliorer leurs produits et fonctionnalités », déclare Downing. "Donc, en ce qui concerne le code qui est déjà sur GitHub, je pense que la réponse à la question de la violation du droit d'auteur est assez simple."

Les choses ne sont pas aussi claires dans un scénario où Copilot est formé sur du code hébergé en dehors de GitHub. Dans cette situation, la question de la violation du droit d'auteur dépendrait largement de la notion d'utilisation loyale.

"Si Copilot est formé sur du code en dehors de GitHub, nous acceptons qu'au moins une partie de ce qu'ils regardent soit un travail protégé par le droit d'auteur", déclare Downing. "Donc, la question devient alors de savoir si c'est une utilisation équitable. Maintenant, vous ne pouvez finalement pas conclure définitivement que quelque chose est une utilisation équitable jusqu'à ce que vous alliez au tribunal et qu'un juge soit d'accord avec votre évaluation. Mais je pense qu'il y a de bonnes raisons de penser que l'utilisation du code par Copilot est très transformatrice - un point qui favoriserait l'argument de l'utilisation équitable.

« Il existe un précédent pour ce genre de situation. Prenons le cas de Google Livres, par exemple. Google a scanné des millions de livres, a fourni aux personnes qui faisaient des recherches la possibilité de rechercher le livre et a fourni à l'utilisateur un petit extrait du texte que l'utilisateur recherchait dans le livre lui-même. Le tribunal a en fait conclu qu'il s'agissait d'un usage loyal. L'utilisation a été très transformatrice. Il a permis aux gens de rechercher des millions de livres. Il ne remplace pas le livre lui-même. Cela n'a rien enlevé aux détenteurs de droits d'auteur; en fait, cela a facilité l'accès des lecteurs à l'œuvre et a en fait ouvert un marché plus large pour les auteurs de livres. Et c'était une énorme valeur ajoutée en plus du corpus protégé par le droit d'auteur.

"Je pense que ces arguments sont vraiment solides et applicables à l'exemple de Copilot, mais comme je l'ai dit, rien n'est vraiment un usage loyal jusqu'à ce qu'un tribunal décide que c'est le cas. Donc, malgré le fait que nous ayons un précédent dans cette direction, cela reste une question ouverte.

Résumer:

  • Downing ne pense pas que GitHub commet une violation du droit d'auteur en formant Copilot sur le code hébergé sur GitHub.
  • Pour le code non hébergé sur GitHub (et donc non régi par les conditions d'utilisation de GitHub) : Downing pense qu'il existe de solides arguments selon lesquels Copilot utilise ledit code de manière transformatrice, ce qui soutiendrait un argument d'utilisation équitable selon lequel il n'y a pas de violation du droit d'auteur. En fin de compte, cependant, nous ne pouvons pas être complètement confiants dans un sens ou dans l'autre tant que l'affaire n'est pas réglée par un tribunal.

Qu'en est-il du copilote GitHub et de la conformité des licences ?

Comme nous l'avons mentionné, GitHub forme Copilot sur de nombreux morceaux de code public, dont beaucoup sont couverts par de fortes licences de copyleft (c'est-à-dire [GPL v2](https://fossa.com/blog/open-source-software-licenses-101- gpl-v2/), GPL v3). Les licences copyleft exigent que les œuvres dérivées (du code sous licence copyleft) portent la même licence que le code original.

En d'autres termes, si une organisation crée et distribue un logiciel (appelons-le « le produit de Jim ») qui comprend du code sous licence GPL v3, le « produit de Jim » devra probablement également être sous licence GPL v3 (il existe une poignée d'exception). Ceci, bien sûr, a le potentiel d'être problématique.

La question est donc de savoir si les utilisateurs de GitHub Copilot créeront par inadvertance des œuvres dérivées de code sous licence copyleft. Selon Downing, la réponse à la question du travail dérivé dépend de la nature précise des suggestions de Copilot.

"C'est vraiment spécifique au cas et reste à voir", dit Downing. « Tout dépend de la rigueur et de la longueur des suggestions de Copilot. Plus la suggestion est complexe et longue, plus elle est susceptible d'avoir une sorte d'expression protégée par le droit d'auteur. Si une suggestion est suffisamment courte, le fait qu'elle répète quelque chose dans le code de quelqu'un d'autre peut ne pas en faire une expression protégée par le droit d'auteur.

"C'est le cas en raison de la façon dont les langages de programmation fonctionnent. Dans certains langages, il existe des noms de classes spécifiques et des noms de fonctions spécifiques. Il y a beaucoup de pièces qui sont réutilisées dans le code, presque comme des blocs de lego. Donc, si la suggestion est assez petite, elle ne contient probablement aucune expression protégée par le droit d'auteur ; la suggestion peut être purement fonctionnelle (c'est-à-dire que c'est la seule façon de faire x dans ce langage).

« Il y a aussi la question de savoir si ce qui est produit est en fait une copie de ce qui est dans le corpus. C'est un peu flou pour le moment. GitHub rapporte que Copilot produit principalement du tout nouveau matériel, ne régurgitant que des copies du code appris 0,1 % du temps. Mais, nous avons vu certains exemples en ligne de suggestions et ces suggestions incluent des quantités assez importantes de code et de code qui sont clairement copiés car ils incluent même des commentaires du code source d'origine.

Résumer:

  • Copilot est loin d'être un produit fini, et la complexité, la longueur et la rigueur de ses suggestions de code semblent varier.
  • Pour cette raison - et le fait que les suggestions de code doivent être suffisamment originales pour répondre à la norme d'expression protégée par le droit d'auteur - il est difficile d'évaluer avec certitude si l'utilisation de Copilot entraînerait la création d'une œuvre dérivée.

Un point de vue pratique sur le copilote et la loi

Comme on pouvait s'y attendre compte tenu du fait que GitHub Copilot n'a que quelques semaines, il y a encore plus de questions que de réponses en matière de violation potentielle du droit d'auteur et de conformité des licences. Cela dit, Downing suggère aux utilisateurs de Copilot d'envisager de prendre certaines précautions simples et directes pour se prémunir contre les problèmes potentiels de conformité des licences.

"Je conseillerais à quiconque utilise Copilot en ce moment pour aider à écrire du code de prêter une attention particulière à la nature des suggestions de Copilot", déclare Downing. "Dans la mesure où vous voyez un morceau de code suggéré qui est très clairement régurgité d'une autre source - peut-être qu'il a encore des commentaires attachés, par exemple - utilisez votre bon sens et n'utilisez pas ce genre de suggestions."

Lire la source

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd