Incidentes Asociados

Inicialmente, el sitio abordó reacción violenta generalizada a los artículos escritos por bots al asegurar a los lectores que un editor humano los estaba verificando cuidadosamente todos antes. a la publicación.
Sin embargo, después, Futurism encontró que se había deslizado una cantidad considerable de errores en el trabajo publicado de la IA. CNET, un titán del periodismo tecnológico que se vendió por $1.8 mil millones en 2008, respondió emitiendo una corrección formidable y lanzando una advertencia sobre todo el trabajo anterior del bot, alertando a los lectores de que el contenido de las publicaciones estaba bajo revisión objetiva. Días después, su empresa matriz Red Ventures anunció en una serie de reuniones internas que estaba pausando temporalmente los artículos generados por IA en CNET y varias otras propiedades, incluida Bankrate, al menos hasta que la [tormenta de prensa negativa se calmó] (https://futurism.com/cnet-bankrate-pausing-ai-generated- contragolpe de contenido).
Ahora, un nuevo desarrollo puede hacer que los esfuerzos para hacer que el programa vuelva a funcionar sean aún más controvertidos para la asediada sala de redacción. Además de esos errores fácticos, una nueva investigación de Futurism encontró amplia evidencia de que el trabajo de CNET AI ha demostrado profundas similitudes estructurales y de redacción con artículos publicados anteriormente en otros lugares, sin dar crédito. En otras palabras, parece que el bot plagió directamente el trabajo de los competidores de Red Ventures, así como de escritores humanos en Bankrate e incluso CNET en sí mismo.
Jeff Schatten, profesor de la Universidad de Washington y Lee que ha estado [examinando el aumento de la mala conducta habilitada por IA] (https://www.chronicle.com/article/will-artificial-intelligence-kill-college-writing), revisó numerosos ejemplos del aparente apuntalamiento del bot que proporcionamos. Descubrió que "claramente" ascendieron al nivel de plagio.
Le preguntamos a Schatten qué sucedería si un estudiante entregara un ensayo con un número comparable de similitudes con documentos existentes sin atribución.
"Serían enviados al consejo de ética dirigido por estudiantes y dada la naturaleza repetida del comportamiento casi seguro que serían expulsados de la universidad", respondió.
El mal comportamiento del bot va desde la copia textual hasta ediciones moderadas y reformulaciones significativas, todo sin acreditar adecuadamente el original. En al menos algunos de sus artículos, parece que prácticamente todas las oraciones se relacionan directamente con algo publicado previamente en otro lugar.
Tome este extracto, por ejemplo, de un artículo reciente de CNET AI sobre la protección contra sobregiros:
Cómo evitar cargos por sobregiros y fondos insuficientes
Los cargos por sobregiro y los cargos por fondos insuficientes no tienen por qué ser una consecuencia común. Hay algunos pasos que puede tomar para evitarlos.
Y compárelo con esta palabrería de un artículo publicado anteriormente en Forbes Advisor, un competidor de Red Ventures:
Cómo evitar cargos por sobregiros y fondos insuficientes
Los cargos por sobregiro y fondos insuficientes no tienen por qué ser la norma. Hay varias herramientas a tu disposición para evitarlas.
Claro, la versión del bot alteró el uso de mayúsculas y cambió algunas palabras por sinónimos impresionantemente laterales: "la norma" se convierte en "una consecuencia común", por ejemplo, y "varias herramientas" se convierte en "unos pocos pasos", junto con un algunos cambios menores en la sintaxis. Pero aparte de esos ajustes semánticos, las dos oraciones son casi idénticas.
Aquí hay otro extracto del mismo artículo del escritor financiero de IA de CNET:
Regístrese para recibir alertas de saldo bajo
Es posible que pueda recibir alertas de saldo bajo desde la aplicación móvil de su banco, para saber si el saldo de su cuenta está cayendo por debajo de cierto límite.
Ahora compárelo con esta sección de otro [artículo publicado anteriormente] (https://www.thebalancemoney.com/how-to-recover-from- being-overdrawn-2386132), este de The Balance, otro competidor de Red Ventures:
Regístrese para recibir alertas de saldo bajo
Puede registrarse para recibir alertas de saldo bajo a través de la mayoría de los bancos para que le avise cuando su cuenta alcance una cierta cantidad.
Nuevamente, parece claro que la IA simplemente está analizando y haciendo pequeñas modificaciones para ocultar la fuente.
A veces, las similitudes son casi cómicas por su falta de sutileza. Tome la primera oración de [este artículo] (https://archive.is/4SVpy#selection-1271.0-1271.62), también publicado por la IA de CNET:
Las tarjetas de regalo son una opción fácil al comprar un regalo para alguien.
Y compárelo con la primera oración de este [_artículo de Forbes] publicado anteriormente (https://www.forbes.com/advisor/credit-cards/can-you-buy-gift-cards-with-a-credit-card/ ):
Las tarjetas de regalo son un regalo fácil de complacer para casi cualquier persona.
¿El truco de eso? Mira la diferencia casi imperceptible entre los titulares de esos dos artículos. Este es el título de _CNET _AI:
¿Se puede comprar una tarjeta de regalo con una tarjeta de crédito?
Y esto es lo que Forbes publicó como titular:
¿Se pueden comprar tarjetas de regalo con una tarjeta de crédito?
Así es: la única diferencia es cambiar "Tarjetas de regalo" a singular.
Aquí hay otro ejemplo, del mismo artículo de CNET generado por IA sobre cargos por sobregiro:
¿Qué es la protección contra sobregiros?
La protección contra sobregiros es una función opcional que ofrecen los bancos para evitar el rechazo de un cargo en una cuenta corriente con fondos insuficientes.
Lo que resulta ser una ensalada de palabras que reformula una línea de este artículo en Investopedia, otro competidor de Red Ventures.
¿Qué es la protección contra sobregiros?
La protección contra sobregiros es un servicio opcional que evita el rechazo de cargos a una cuenta bancaria... que superen los fondos disponibles en la cuenta.
A veces, la IA también parece tomar prestado el lenguaje de los escritores del sitio hermano de CNET Bankrate sin dar crédito_._ Por ejemplo, mire esta línea de un artículo publicado por la IA de CNET en noviembre :
Convertirse en un usuario autorizado puede ayudarlo a evitar solicitar una tarjeta por su cuenta, lo cual es un gran beneficio si actualmente tiene mal crédito o no tiene historial crediticio.
Y compárelo con este texto, [publicado anteriormente](https://www.bankrate.com/finance/credit-cards/pros-cons- being-an-authorized-user/) por un escritor de Bankrate:
Convertirse en un usuario autorizado también le permite evitar tener que solicitar una tarjeta por su cuenta, lo cual es un gran beneficio si actualmente tiene mal crédito o no tiene ningún historial crediticio.
En total, surge rápidamente un patrón. Esencialmente, la IA de CNET parece abordar un tema examinando artículos similares que ya se han publicado y extrayendo oraciones de ellos. A medida que avanza, realiza ajustes, a veces menores, a veces importantes, en la sintaxis, la elección de palabras y la estructura de la oración original. A veces mezcla dos oraciones, o separa una, o ensambla fragmentos en nuevas oraciones francas. Luego parece repetir el proceso hasta que se cocina un artículo completo.
Un empleado actual de Red Ventures también revisó ejemplos del trabajo aparentemente elevado del bot.
"Alguna vez le copiaste la tarea a alguien", bromearon, "¿pero te dijeron que la reformularas?".
"Plantea la pregunta de qué tipo de instituciones quieren ser vistos como CNET y Bankrate", continuaron. "Simplemente están tomando estos artículos y reformulando un par de cosas".
En resumen, un examen detallado del trabajo producido por la IA de CNET hace que parezca menos un generador de texto sofisticado y más una máquina de plagio automatizada, que genera casualmente trabajo robado que provocaría el despido de un periodista humano.
Quizás, al final del día, nada de esto debería ser terriblemente sorprendente. En esencia, la forma en que funcionan los sistemas de aprendizaje automático es que alimenta una inmensa pila de "datos de entrenamiento", los procesa con algoritmos sofisticados y termina con un modelo que puede producir un trabajo similar bajo demanda.
Los investigadores a veces han encontrado ejemplos de AI plagiando sus propios datos de entrenamiento. En 2021, por ejemplo, investigadores de la Universidad Johns Hopkins, la Universidad de Nueva York y Microsoft encontraron que las IA generadoras de texto "a veces copian sustancialmente, en algunos casos duplican pasajes más de 1000 palabras del conjunto de entrenamiento".
Como tal, la cuestión de cómo se entrenó exactamente la desastrosa IA de _CNET' puede terminar ocupando un lugar central a medida que el drama continúa desarrollándose. En una reunión de la empresa CNET a fines de la semana pasada, _The Verge _informó en ese momento , el vicepresidente ejecutivo de contenido y audiencia del medio se negó a decirle al personal, muchos de ellos aclamados periodistas tecnológicos que han escrito extensamente sobre el auge del aprendizaje automático, qué datos se habían utilizado para entrenar la IA.
[varios](https://www.buzzfeednews.com/article/pranavdixit/ai-art-generators-lawsuit- stable-diffusion-midjourney) demandas contra los creadores de imágenes destacadas generadores, y podría convertirse en un punto crítico en la comercialización de la tecnología.
"Si un estudiante presentara el equivalente de lo que CNET ha producido para una tarea en mi clase, y si no citara sus fuentes, definitivamente lo consideraría plagio", dijo Antony Aumann, profesor de filosofía en la Universidad del Norte de Michigan que titulares aparecidos recientemente cuando descubrió que uno de sus propios estudiantes había enviado un ensayo generado con ChatGPT, después de revisar ejemplos de CNET AI redacción similar a otros puntos de venta.
"Ahora, existe cierta disputa entre los académicos sobre qué es exactamente el plagio", continuó. "Algunos eruditos lo consideran una forma de robar; otros eruditos lo consideran una especie de mentira. Pienso en ello de la última manera. El plagio implica presentar algo como propio que de hecho no es suyo. Y eso parece ser lo que CNET está haciendo".
CNET no respondió a los ejemplos de la escritura aparentemente manipulada del bot, ni a las preguntas sobre esta historia.
En cierto sentido, la implacable ineptitud de la IA sin cerebro de la empresa probablemente ofusca muchos de los temas más espinosos que probablemente veremos surgir a medida que la tecnología continúa extendiéndose en el lugar de trabajo y los ecosistemas de información.
Schatten, por ejemplo, advirtió que es probable que los problemas relacionados con la IA y la propiedad intelectual se vuelvan más ambiguos y difíciles de detectar a medida que los sistemas de IA continúan mejorando, o incluso a medida que los editores comienzan a experimentar con sistemas más avanzados que ya existen (Red Ventures se ha negado a diga qué IA está usando, aunque el editor en jefe de CNET ha dicho que no es ChatGPT).
"El ejemplo de CNET es digno de mención porque cualquier IA que estuvieran usando no se basaba en la totalidad de Internet y creaba cuidadosamente un nuevo mosaico, sino que simplemente extraía más o menos palabra por palabra de las historias existentes", dijo Schatten. "Pero las IA más sofisticadas de hoy, y ciertamente las IA del futuro, harán un mejor trabajo al ocultar los orígenes del material".
"Y especialmente una vez que las IA se basan en la escritura de otras IA, que a su vez citan a la IA (oscuro, lo sé) podría volverse bastante difícil de detectar", agregó.
En un sentido práctico, parece cada vez más obvio que CNET y Red Ventures implementaron el sistema de IA y comenzaron a enviar sus artículos a la colosal audiencia del sitio sin siquiera examinar realmente su producción. No fue solo que los arquitectos del programa pasaron por alto errores fácticos obvios, sino que parece que nunca verificaron si el trabajo del sistema podría haber sido robado.
Y para ser justos, ¿por qué lo harían? Como The Verge informó en un fascinante análisis profundo la semana pasada, el La estrategia principal de la empresa es publicar cantidades masivas de contenido, cuidadosamente diseñado para obtener una alta clasificación en Google y cargado con lucrativos enlaces de afiliados.
Para Red Ventures, The Verge found, esas prioridades han transformado el una vez venerable _CNET _en una "máquina de dinero SEO impulsada por IA".