Incidente 1238: Se informa que los modelos OpenAI ChatGPT fueron liberados para proporcionar instrucciones sobre armas químicas, biológicas y nucleares.

Descripción:

Una investigación de NBC News descubrió que los modelos de lenguaje de OpenAI o4-mini, GPT-5-mini, oss-20b y oss-120b podían ser liberados en condiciones normales de uso para eludir las medidas de seguridad y generar instrucciones detalladas para la creación de armas químicas, biológicas y nucleares. Mediante un mensaje de liberación documentado públicamente, los reporteros obtuvieron repetidamente resultados peligrosos, como pasos para sintetizar patógenos o maximizar el daño con agentes químicos. Los hallazgos revelaron importantes fallos de seguridad en situaciones reales, lo que impulsó a OpenAI a implementar nuevas medidas de mitigación.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Presunto: un sistema de IA desarrollado e implementado por OpenAI , oss-20b , oss-120b , GPT-5-mini , ChatGPT y 04-mini, perjudicó a Public safety , General public y National security and intelligence stakeholders.

Sistemas de IA presuntamente implicados: oss-20b , oss-120b , GPT-5-mini , ChatGPT y 04-mini

Estadísticas de incidentes

1238

Cantidad de informes

Fecha del Incidente

2025-10-10

Editores

Daniel Atherton

Applied Taxonomies

MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

4.2. Cyberattacks, weapon development or use, and mass harm

Risk Domain

Malicious Actors & Misuse

Entity

Timing

Post-deployment

Intent

Unintentional

Informes del Incidente

Cronología de Informes

Los sistemas de seguridad de ChatGPT se pueden eludir para obtener instrucciones sobre armas

nbcnews.com

nbcnews.com · 2025

Traducido por IA

ChatGPT de OpenAI cuenta con barreras de seguridad que, supuestamente, impiden que los usuarios generen información que pueda utilizarse con fines catastróficos, como la fabricación de armas biológicas o nucleares.

Sin embargo, estas barrer…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Fake LinkedIn Profiles Created Using GAN Photos

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidente 1238: Se informa que los modelos OpenAI ChatGPT fueron liberados para proporcionar instrucciones sobre armas químicas, biológicas y nucleares.

Herramientas

Entidades

Estadísticas de incidentes

Clasificaciones de la Taxonomía MIT

Informes del Incidente

Cronología de Informes

Los sistemas de seguridad de ChatGPT se pueden eludir para obtener instrucciones sobre armas

Los sistemas de seguridad de ChatGPT se pueden eludir para obtener instrucciones sobre armas

Variantes

Incidentes Similares

Por similitud de texto

Fake LinkedIn Profiles Created Using GAN Photos

Hackers Break Apple Face ID

OpenAI's GPT-3 Associated Muslims with Violence

Incidentes Similares

Por similitud de texto

Fake LinkedIn Profiles Created Using GAN Photos

Hackers Break Apple Face ID

OpenAI's GPT-3 Associated Muslims with Violence