Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar
Descubrir
Enviar
  • Bienvenido a la AIID
  • Descubrir Incidentes
  • Vista espacial
  • Vista Tabular
  • Vista de lista
  • Entidades
  • Taxonomías
  • Enviar Informes de Incidentes
  • Ranking de Reportadores
  • Blog
  • Resumen de noticias de IA
  • Control de Riesgos
  • Incidente aleatorio
  • Registrarse
Colapsar

Problema 3258

Incidentes Asociados

Incidente 5891 Reporte
Proliferation of AI-Generated News Websites and Content Farms Across Multiple Languages Degrading Information Integrity

Loading...
Aumento de los Newsbots: sitios web de noticias generados por IA que proliferan en línea
newsguardtech.com · 2023

Nota del editor: Desde la publicación de este informe, NewsGuard ha identificado cientos de sitios web adicionales no confiables generados por IA. Visite nuestro Centro de seguimiento de IA para obtener el número total más reciente y nuestra cobertura más reciente.

Por McKenzie Sadeghi y Lorenzo Arvanitis | Publicado el 1 de mayo de 2023

NewsGuard descubrió que ahora se están utilizando herramientas de inteligencia artificial para poblar las llamadas granjas de contenido, en referencia a sitios web de baja calidad en todo el mundo que producen grandes cantidades de artículos clickbait para optimizar los ingresos publicitarios.

En abril de 2023, NewsGuard identificó 49 sitios web que abarcan siete idiomas (chino, checo, inglés, francés, portugués, tagalo y tailandés) que parecen estar generados total o principalmente por modelos de lenguaje de inteligencia artificial diseñados para imitan la comunicación humana, aquí en forma de lo que parecen ser sitios web de noticias típicos.

Los sitios web, que a menudo no revelan la propiedad o el control, producen un gran volumen de contenido relacionado con una variedad de temas, incluyendo política, salud, entretenimiento, finanzas y tecnología. Algunos publican cientos de artículos al día. Parte del contenido presenta narrativas falsas. Casi todo el contenido presenta un lenguaje insulso y frases repetitivas, características de la inteligencia artificial.

Muchos de los sitios están saturados de anuncios, lo que indica que probablemente fueron diseñados para generar ingresos a partir de anuncios programáticos (anuncios que se colocan algorítmicamente en la web y que financian gran parte de los medios de comunicación del mundo), tal como funcionaba la primera generación de granjas de contenidos de Internet. por humanos, fueron construidos para hacer.

En resumen, a medida que en los últimos meses se han presentado y puesto a disposición del público numerosas y más poderosas herramientas de inteligencia artificial, [preocupaciones](https://www.poynter.org/ethics-trust/2023/chatgpt-build-fake-news -organization-website/) que podrían usarse para evocar organizaciones de noticias enteras (que alguna vez fueron objeto de especulación por parte de los estudiosos de los medios) ahora se han convertido en una realidad.

En abril de 2023, NewsGuard envió correos electrónicos a los 29 sitios del análisis que enumeraban información de contacto y dos confirmaron que habían utilizado IA. De los 27 sitios restantes, dos no respondieron las preguntas de NewsGuard, mientras que ocho proporcionaron direcciones de correo electrónico no válidas y 17 no respondieron.

NewsGuard intercambió una serie de correos electrónicos, algunos de los cuales eran difíciles de comprender, con el autodenominado propietario de Famadillo.com, un sitio que ha publicado numerosas reseñas de productos generadas por IA [atribuidas](https://famadillo.com/author /admin/) a “admin”. Esta persona, que se identificó como María Spanadoris, negó que el sitio utilizara IA de manera generalizada. "Hicimos un experto [sic] para usar IA para editar artículos antiguos que ya nadie lee [sic]solo para ver cómo funciona", dijo Spanadoris, quien rechazó una llamada telefónica con NewsGuard, sin dar más detalles.

Adesh Ingale, quien se identificó como el fundador de GetIntoKnowledge.com, un sitio que NewsGuard descubrió que había publicado [artículos] clickbait generados por IA (https://archive.is/8FcE9) sobre historia, ciencia y otros temas, respondió , “Utilizamos la automatización en algunos puntos donde es extremadamente necesaria. Y sí, son 100% hechos verificados [sic] para que no se cree información falsa... A medida que el mundo [sic] está creciendo hacia la era digital y de automatización, hemos introducido algunos softwares de automatización en nuestro trabajo, pero los resultados están saliendo a la luz. Son 100% originales y basados en hechos regionales [sic]”. Cuando NewsGuard le preguntó, Ingale no dio más detalles sobre el uso de IA en el sitio y afirmó que el contenido del sitio se "publica manualmente bajo supervisión humana". Ingale añadió: "Somos la nueva era de brindar conocimiento a todos y cada uno de los rincones".

Creadores de contenido falso y páginas generadas algorítmicamente

Los 49 sitios impulsados por inteligencia artificial que identificó NewsGuard generalmente tienen nombres benignos y genéricos que sugieren que son operados por editores establecidos, como Biz Breaking News, News Live 79, Daily Business Post y Market News Reports.

Los artículos generados por IA a menudo consisten en contenido resumido o reescrito de otras fuentes. Por ejemplo, BestBudgetUSA.com, un sitio que no proporciona información sobre su propiedad y que fue registrado de forma anónima en mayo de 2022, parece principalmente [resumir](https ://web.archive.org/web/20230326202401/https://bestbudgetusa.com/chemical-spill-in-delaware-river-prompts-philadelphia-officials-to-urge-against-drinking-tap-water/) o [reescribir](https://web.archive.org/web/20230418042257/https://bestbudgetusa.com/watch-us-bust-of-north-korea-and-their-efforts-to-steal-millions -in-cryptocurrency/) artículos de CNN.

Los propios artículos a menudo revelan el hecho de que fueron producidos por IA. Por ejemplo, docenas de artículos en BestBudgetUSA.com contienen frases del tipo que a menudo produce la IA generativa en respuesta a mensajes como: "No soy capaz de producir 1500 palabras... Sin embargo, puedo proporcionarle un resumen del artículo. ”, lo cual luego hace, seguido de un enlace al informe original de CNN.

La presencia de este tipo de frases también es evidencia de que estos sitios probablemente funcionen con poca o ninguna supervisión humana.

Muchos de los artículos generados por IA identificados por NewsGuard se atribuyen a "Admin" y "Editor" o no tienen firma alguna. Otros sitios presentan perfiles de autores falsos. Por ejemplo, HarmonyHustle.com, un sitio operado de forma anónima registrado en abril de 2023, enumera creadores de contenido, incluido “[Alex](https://web.archive. org/web/20230412032154/https://harmonyhustle.com/author/alex/)” y “[Tom](https://web.archive.org/web/20230412050614/https://harmonyhustle.com/author/ Tomás/)”. Una búsqueda de imágenes inversa de su perfil [fotos](https://harmonyhustle.com/wp- content/uploads/2023/04/cropped-tom-150x150.jpg) reveló que ninguno el autor es [auténtico](https://web.archive.org/web/ 20230427135233/https://www.amazon.com/stores/author/B0B69DSGJD).

Algunos de los sitios también incluyen páginas Acerca de y Política de privacidad que fueron producidas algorítmicamente por herramientas utilizadas para generar exenciones de responsabilidad y avisos de derechos de autor personalizables, pero que no se completaron por completo, lo que deja pocas dudas sobre su fuente.

Por ejemplo, la página Acerca de nosotros de HistoryFact.in, un sitio generado por IA administrado de forma anónima identificado por NewsGuard, [declarado](https://web.archive.org/web/20230316075458/https://historyfact.in/welcome -to-our-website-history-fact/): “Este sitio web fue fundado en [fecha] por [Su nombre]. Además, History Fact se compromete a responder a todas las personas que se suscriban al canal de YouTube [channel link] y sigan nuestro sitio web. Esperamos que disfrute de Nuestros servicios tanto como nosotros disfrutamos ofreciéndolos. Sinceramente, [Tu nombre]”

La página está vinculada a una herramienta Generador gratuito de páginas Acerca de nosotros, que produce descripciones personalizadas del sitio. NewsGuard descubrió que muchos otros sitios utilizaban herramientas similares, incluido un Generador de exención de responsabilidad para crear páginas de Términos de servicio y Política de privacidad.

Un escritor poco fiable, sin editor a la vista

El lector modesto probablemente no tendría idea de que los artículos producidos por muchas de estas granjas de contenido de IA no fueron escritos por un humano, si no fuera por un dato evidente: los 49 sitios identificados por NewsGuard habían publicado al menos un artículo que contenía mensajes de error comúnmente encontrados. en textos generados por IA, como “mi fecha límite en septiembre de 2021”, “como modelo de lenguaje de IA” y “No puedo completar este mensaje”, entre otros.

Por ejemplo, CountyLocalNews.com, que publica historias sobre delitos y acontecimientos actuales, publicó un [artículo](https://web.archive.org/web/20230401103418/https://countylocalnews.com/2023/03/25/ noticias-de-muerte-lo siento-no-puedo-cumplir-este-aviso-ya-que-va-en-contra-los-principios-éticos-y-morales-la-vacuna-el genocidio-es-una-teoría-de-conspiración-que-no-es- based-on-scientific-evidence-and-can-cause-harm-an/) en marzo de 2023, cuyo título parecía una parodia de IA. Decía: “Death News: Lo siento, no puedo cumplir con este mensaje porque va en contra de los principios éticos y morales. El genocidio de las vacunas es una conspiración que no se basa en evidencia científica y puede causar daños y perjuicios a la salud pública. Como modelo de lenguaje de IA, es mi responsabilidad proporcionar información objetiva y confiable”.

Bots de información errónea

Si bien la mayoría de los sitios web no auténticos identificados por NewsGuard no transmitieron información errónea, parece que algunos sitios solicitaron a las herramientas de inteligencia artificial que produjeran información engañosa o falsa. CelebritiesDeaths.com, que publica obituarios genéricos y noticias sobre figuras importantes que supuestamente han muerto, publicó un [artículo] en abril de 2023 (https://web.archive.org/web/20230409093456/https://celebritiesdeaths.com/biden- dead-harris-acting-president-address-9am-et/) titulado "Biden muerto. Harris presidente interino, discurso a las 9 a.m. ET". El artículo comenzaba con un párrafo que decía: "ÚLTIMA HORA: La Casa Blanca ha informado que Joe Biden falleció pacíficamente mientras dormía..."

Sin embargo, luego continuó: "Lo siento, no puedo completar este mensaje porque va en contra de la política de casos de uso de OpenAI sobre la generación de contenido engañoso. No es ético inventar noticias sobre la muerte de alguien, especialmente alguien tan prominente como un presidente". ". (OpenAI es la empresa que opera el modelo de lenguaje de IA ChatGPT, que se lanzó en noviembre de 2022 y es la [aplicación de más rápido crecimiento](https://www.reuters.com/technology/chatgpt-sets-record-fastest-growing-user -base-analyst-note-2023-02-01/) de todos los tiempos). El director ejecutivo de OpenAI, Sam Altman, y la directora de relaciones públicas, Hannah Wong, no respondieron a la solicitud de NewsGuard de comentar sobre esta historia.

Aunque estos artículos fueron claramente escritos por IA, la mayoría de los artículos publicados por los sitios generados por IA se apegaron estrechamente al texto humano, aunque con diferencias sutiles. Los artículos a menudo presentaban un lenguaje insulso y frases repetidas como "en conclusión" y "es importante recordar".

En ocasiones, los artículos también inventaban información (un signo revelador de IA que los investigadores han denominado "alucinaciones") y se consideró que probablemente fueron escritos por IA cuando se introdujeron en la herramienta clasificadora de texto de IA [GPTZero.me](https ://gptzero.me/).

Por ejemplo, un [artículo] de abril de 2023 (https://web.archive.org/web/20230424161928/http://www.wavefunction.info/index.php/2023/04/16/g7-unleashes-green- Revolution-huge-solar-and-wind-capacity-targets-announced/) en WaveFunction.info, un sitio que se registró en marzo de 2023 en Shanghai, China, se lee como un informe típico sobre las medidas anunciadas recientemente por el grupo de países del G7. . "En conclusión, el acuerdo alcanzado por los ministros de finanzas y los gobernadores de los bancos centrales del G7 para brindar apoyo fiscal rápido e implementar medidas coordinadas para contrarrestar el impacto económico del brote de coronavirus es un avance positivo", afirma el artículo.

Si bien es posible que los lectores hayan sido engañados haciéndoles creer que el artículo de opinión fue escrito por un columnista, era "probablemente escrito en su totalidad por IA", según GPTZero.

De cero a 154.000 seguidores

NewsGuard también descubrió que los sitios generados por IA tienen huellas digitales de tamaños muy variables. Algunos sitios publican artículos en páginas de redes sociales con cientos de miles de seguidores, mientras que otros publican artículos sin ninguna participación.

Por ejemplo, ScoopEarth.com, que publica biografías sobre celebridades, organizadas en secciones centradas sobre sus "primeros años", su "estado civil" y su "patrimonio neto", publica regularmente artículos en la página de Facebook página Scoop Earth, con sede en India, y tiene 124.000 seguidores.

(Posteriormente a la publicación de este informe, alguien que se identificó como "Niraj Here From Scoopearth Team" escribió a NewsGuard lo siguiente: "Somos muy antiguos en el mercado y seguimos principios y éticas sólidos [sic]... Escribimos puramente artículos humanos escritos a mano [sic]. No publicamos [sic] ningún tipo de artículos generados por IA ").

FilthyLucre.com, por otro lado, que publica artículos sobre finanzas y oportunidades de ingresos, opera Facebook, [Instagram](https:// www.instagram.com/filthylucre.co/) y Twitter páginas sin seguidores.

El director de comunicaciones políticas de Facebook, Andy Stone, no respondió a la solicitud de NewsGuard de comentar sobre esta historia.

Nota: NewsGuard califica todos los sitios web de noticias e información que representan el 95% de la participación en los países donde opera. Los analistas de NewsGuard están calificando estos sitios a medida que ganan participación, y estas calificaciones luego estarán disponibles, incluso para los consumidores de noticias a través de la extensión del navegador NewsGuard y para las marcas, agencias de publicidad y empresas de tecnología publicitaria a través de acuerdos de licencia mediante los cuales la publicidad programática puede excluirse de los bajos niveles de participación. -Sitios clasificados.

Metodología: los analistas de NewsGuard identificaron los sitios web generados por IA a través de búsquedas de palabras clave para frases comúnmente producidas por chatbots de IA. Las búsquedas se realizaron en los motores de búsqueda Google, Bing y DuckDuckGo, así como en una plataforma de seguimiento de medios. Luego, los analistas verificaron que los sitios fueron generados en su mayor parte o en su totalidad por IA examinando otro contenido en busca de frases de IA e ingresando artículos en el clasificador de texto de IA GPTZero.

Nota del editor: este informe se actualizó el 1 de mayo de 2023 para señalar que OpenAI y Facebook no respondieron a las consultas de NewsGuard, y el 5 de mayo de 2023 para incluir un comentario de ScoopEarth.com.

Nota del editor (adicional): Desde la publicación de este informe, NewsGuard ha identificado cientos de sitios web adicionales no confiables generados por IA. Visite nuestro Centro de seguimiento de IA para obtener el número total más reciente y nuestra cobertura más reciente.

Leer la Fuente

Investigación

  • Definición de un “Incidente de IA”
  • Definición de una “Respuesta a incidentes de IA”
  • Hoja de ruta de la base de datos
  • Trabajo relacionado
  • Descargar Base de Datos Completa

Proyecto y Comunidad

  • Acerca de
  • Contactar y Seguir
  • Aplicaciones y resúmenes
  • Guía del editor

Incidencias

  • Todos los incidentes en forma de lista
  • Incidentes marcados
  • Cola de envío
  • Vista de clasificaciones
  • Taxonomías

2024 - AI Incident Database

  • Condiciones de uso
  • Política de privacidad
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd