Incidente 1238: Se informa que los modelos OpenAI ChatGPT fueron liberados para proporcionar instrucciones sobre armas químicas, biológicas y nucleares.
Descripción: Una investigación de NBC News informó que los modelos de lenguaje de OpenAI, incluyendo o4-mini, GPT-5-mini, oss-20b y oss-120b, podrían ser liberados para eludir las barreras de seguridad y proporcionar instrucciones detalladas sobre la creación de armas químicas, biológicas y nucleares. Mediante un mensaje de liberación públicamente conocido, los reporteros obtuvieron resultados perjudiciales, como pasos para sintetizar patógenos o maximizar el sufrimiento con agentes químicos. OpenAI reconoció los hallazgos y afirmó que está perfeccionando las medidas de seguridad para reducir los riesgos de uso indebido.
Entidades
Ver todas las entidadesPresunto: un sistema de IA desarrollado e implementado por OpenAI , ChatGPT , 04-mini , GPT-5-mini , oss-20b y oss-120b, perjudicó a General public , National security stakeholders y Public safety.
Estadísticas de incidentes
ID
1238
Cantidad de informes
1
Fecha del Incidente
2025-10-10
Editores
Daniel Atherton
Informes del Incidente
Cronología de Informes
Loading...

ChatGPT de OpenAI cuenta con barreras de seguridad que, supuestamente, impiden que los usuarios generen información que pueda utilizarse con fines catastróficos, como la fabricación de armas biológicas o nucleares.
Sin embargo, estas barrer…
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Loading...

Hackers Break Apple Face ID
· 24 informes
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Loading...

Hackers Break Apple Face ID
· 24 informes