Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Problema 1767

Incidentes Asociados

Incidente 2405 Reportes
GitHub Copilot, Copyright Infringement and Open Source Licensing

Loading...
GitHub Copilot, infracción de derechos de autor y licencias de código abierto
thenewstack.io · 2021

A principios de esta semana, GitHub presentó GitHub Copilot, una nueva función a la que se refiere como "su Programador de pares de IA”, pero también podría llamarse apropiadamente “IntelliSense con esteroides”. Creada con OpenAI Codex, un nuevo sistema que, según la compañía, es "significativamente más capaz que GPT-3 en la generación de código", la herramienta no solo autocompleta las líneas de código, sino que ofrece bloques completos de código en respuesta tanto al código que escribes como al código. lenguaje natural.

Habiendo sido “entrenado en miles de millones de líneas de código público”, una de las primeras preguntas que ha surgido con respecto a Copilot se ha centrado en cuestiones de derechos de autor, apuntando específicamente a la idea de la [licencia GPL] viral (https://www. gnu.org/licenses/gpl-3.0.en.html), que requiere que todos los trabajos derivados tengan la misma licencia.

los derechos de autor no solo cubren copiar y pegar; cubre obras derivadas. github copilot fue entrenado en código fuente abierto y la suma total de todo lo que sabe se extrajo de ese código. no hay interpretación posible de “derivado” que no incluya este

— eevee (@eevee) 30 de junio de 2021

Ahora, si bien hay muchas conversaciones flotando en Twitter y algunas [subprocesos de Hacker News] (https://news.ycombinator.com/item?id=27687450), la mayor parte, como era de esperar, cae bajo el Descargo de responsabilidad “No soy abogado”. Hay un comentario de Hacker News, del CEO de GitHub Nat Friedman, sin embargo , que ofrece un poco de respuesta a preguntas en esta misma línea.

"En general", escribe Friedman, "(1) entrenar sistemas ML en datos públicos es un uso justo (2) la salida pertenece al operador, al igual que con un compilador". Luego ofrece un enlace a la posición de OpenAI sobre el entrenamiento de modelos de aprendizaje automático, que argumenta que "entrenar Los sistemas de IA constituyen un uso justo” y, además, que “las consideraciones de política que subyacen a la doctrina del uso justo respaldan la conclusión de que el entrenamiento de los sistemas de IA constituye un uso justo”.

Bueno, por supuesto, pensamos que podrías decir algo así, Nat.

Pero Friedman no está solo: un par de abogados y expertos en derecho de propiedad intelectual abordaron el tema y, al menos en su análisis preliminar, tendieron a estar de acuerdo con Friedman. Primero, Neil Brown examina la idea [desde la perspectiva de la ley inglesa](https://decoded.legal/blog/2021/06/github-copilot -pensamientos-iniciales-desde-una-perspectiva-de-la-ley-inglesa) y, aunque no está tan seguro de la idea de "uso justo" si la idea se lleva fuera de los EE. UU., simplemente señala [los términos de servicio de GitHub] (https://docs.github.com/en/github/site-policy/github-terms-of-service) como evidencia suficiente de que la empresa probablemente puede hacer lo que está haciendo. Brown señala el pasaje D4, que otorga a GitHub "el derecho a almacenar, archivar, analizar y mostrar Su Contenido, y hacer copias incidentales, según sea necesario para proporcionar el Servicio, incluida la mejora del Servicio con el tiempo”.

“La licencia está redactada en términos generales y estoy seguro de que hay margen para la discusión, pero si resulta que Github no requiere una licencia para sus actividades, entonces, con respecto al código alojado en Github, sospecho que podría hacer un caso razonable de que la concesión de licencia obligatoria en sus términos cubre esto en contra del cargador”, escribe Brown. En general, sin embargo, Brown dice que tiene "más preguntas que respuestas".

He visto el código fuente para esto. Recuerdo algo como pic.twitter.com/vVRSlUSU2e

— Tomáš Rottenberg (@hacksparr0w) 29 de junio de 2021

En una versión más definitiva, Andres Guadamuz, profesor titular de derecho de propiedad intelectual en la Universidad de Sussex y editor en jefe del Journal of World Intellectual Property, aborda la cuestión de si GitHub Copilot está infringiendo o no los derechos de autor, y concluye que "esto no es una infracción de derechos de autor ni una infracción de licencia, pero estoy feliz de estar convencido de lo contrario".

Sobre la idea de la infracción de derechos de autor, Guadamuz primero señala un artículo de investigación de Alber Ziegler publicado por GitHub, que analiza situaciones en las que Copilot reproduce textos exactos y encuentra que esos casos son extremadamente raros. En el documento original, Ziegler señala que "cuando una sugerencia contiene fragmentos copiados del conjunto de entrenamiento, la interfaz de usuario simplemente debe decirle de dónde se cita", como una solución contra los reclamos de infracción.

Sobre la idea de la licencia GPL y las obras “derivadas”, Guadamuz nuevamente no está de acuerdo, argumentando que el tema en cuestión se reduce a cómo la GPL define las obras modificadas, y que “la derivación, modificación o adaptación (dependiendo de su jurisdicción) tiene un significado específico dentro de la ley y la licencia.”

“Solo necesitas cumplir con la licencia si modificas la obra, y esto se hace solo si tu código está basado en el original en la medida en que requeriría un permiso de derechos de autor, de lo contrario no requeriría una licencia”, escribe Guadamuz. . “Como he explicado, me parece extremadamente improbable que un código similar copiado de esta manera alcance el umbral de infracción de derechos de autor, no hay suficiente código copiado, e incluso si lo hay, parece ser en su mayoría código muy básico que es común. a otros proyectos.”

Si bien Copilot definitivamente parece escupir código palabra por palabra de vez en cuando, es la poca frecuencia de esa ocurrencia lo que parece asegurarle a Guadamuz que la herramienta está en poco peligro de ser litigada con éxito. En un comentario sobre su artículo, escribe que "todo esto se resolverá eventualmente con Codex y Copilot ofreciendo una herramienta de similitud donde los programadores pueden verificar si hay alguna recitación en su código", lo que podría ayudar con escenarios como este:

No quiero decir nada, pero esa no es la licencia correcta, Sr. Copiloto. pic.twitter.com/hs8JRVQ7xJ

— Armin Ronacher (@mitsuhiko) 2 de julio de 2021

Y mientras estamos aquí, si la infracción de derechos de autor y las licencias de código abierto son una preocupación menor para usted, y está más interesado en cuán genial y útil podría ser una herramienta como GitHub Copilot, asegúrese de visitar y leer El análisis de Darryl Taft de Copilot, al que llama "[Un autocompletado poderoso y controvertido para desarrolladores] (https://thenewstack.io/github-copilot-a-powerful-controversial-autocompletado-para-desarrolladores/)".

Leer la Fuente

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd