Incidente 1135: Se informa que preimpresiones de investigadores de varias universidades contienen indicaciones encubiertas de IA
Descripción: Se descubrieron indicaciones ocultas en al menos 17 prepublicaciones académicas en arXiv que supuestamente instruían a las herramientas de IA a proporcionar únicamente revisiones por pares positivas. Los autores principales están afiliados a 14 instituciones en ocho países, entre ellas la Universidad de Waseda, KAIST, la Universidad de Pekín y la Universidad de Washington. Las supuestas instrucciones ocultas, algunas de las cuales, según se informa, estaban incrustadas con texto blanco o tipografía diminuta, supuestamente pretendían influir en los revisores que utilizan herramientas de IA.
Entidades
Ver todas las entidadesAlleged: Unnamed large language model developers developed an AI system deployed by Unnamed peer reviewers y Unnamed conference paper reviewers, which harmed Peer review process , Academic integrity , Academic conferences y Research community.
Sistema de IA presuntamente implicado: Unknown large language models
Estadísticas de incidentes
ID
1135
Cantidad de informes
1
Fecha del Incidente
2025-07-01
Editores
Daniel Atherton
Applied Taxonomies
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
4.3. Fraud, scams, and targeted manipulation
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Malicious Actors & Misuse
Entity
Which, if any, entity is presented as the main cause of the risk
Human
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Pre-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Intentional
Informes del Incidente
Cronología de Informes
Loading...
TOKIO -- Nikkei ha descubierto que artículos de investigación de 14 instituciones académicas en ocho países, incluyendo Japón, Corea del Sur y China, contenían indicaciones ocultas que indicaban a las herramientas de inteligencia artificial…
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents


