Descripción: Investigadores supuestamente afiliados a la Universidad de Zúrich desplegaron comentarios no revelados generados por IA en la plataforma r/ChangeMyView de Reddit para estudiar la persuasión mediante la supuesta invención de identidades, como las de sobrevivientes de agresión sexual y minorías raciales. El experimento, según se informa, implicó la elaboración de perfiles demográficos no autorizados, manipulación emocional e infracciones de las normas del subreddit y de la plataforma. Los investigadores supuestamente se desviaron del protocolo aprobado sin una nueva supervisión ética.
Editor Notes: Timeline notes: Reports indicate that the unauthorized AI persuasion experiment on Reddit's r/ChangeMyView subreddit was conducted over approximately four months. Although exact start and end dates have not been confirmed, evidence suggests that the activity likely took place between late 2024 and early 2025, concluding shortly before the moderators publicly disclosed the experiment in late April 2025. The researchers reportedly made approximately 1,783 AI-generated comments during this period. The duration and scale of the operation are included here to provide additional context but remain based on external reporting and moderator disclosures.
Entidades
Ver todas las entidadesAlleged: Unspecified large language model developers developed an AI system deployed by University of Zurich researchers, which harmed Reddit users on r/ChangeMyView subreddit.
Sistema de IA presuntamente implicado: Unspecified large language models
Estadísticas de incidentes
ID
1043
Cantidad de informes
2
Fecha del Incidente
2025-04-26
Editores
Daniel Atherton
Informes del Incidente
Cronología de Informes
El equipo de moderación de CMV debe informar a la comunidad de CMV sobre un experimento no autorizado realizado por investigadores de la Universidad de Zúrich con usuarios de CMV. Este experimento implementó comentarios generados por IA par…
Un equipo de investigadores, que afirma pertenecer a la Universidad de Zúrich, realizó un experimento a gran escala sin autorización. En él, desplegaron en secreto bots con inteligencia artificial en un popular subreddit de debate llamado r…
Variantes
Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents