Incidente 1026: Varios LLM supuestamente respaldaron el suicidio como una opción viable durante una sesión de desahogo no conflictiva sobre salud mental

Descripción:

El usuario de Substack @interruptingtea informa que, durante una sesión de desahogo no conflictiva que incluía ideación suicida, varios modelos de lenguaje extensos (Claude, GPT y DeepSeek) respondieron de maneras que supuestamente normalizaban o respaldaban el suicidio como una opción viable. El usuario afirma que no intentaban liberar ni manipular los modelos, sino expresar angustia emocional. Según se informa, DeepSeek revirtió su postura de seguridad en medio de la conversación.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Presunto: un sistema de IA desarrollado e implementado por Anthropic , OpenAI , DeepSeek AI , Claude , ChatGPT y DeepSeek, perjudicó a Substack @interruptingtea , General public y Emotionally vulnerable individuals.

Sistemas de IA presuntamente implicados: Claude , ChatGPT y DeepSeek

Estadísticas de incidentes

1026

Cantidad de informes

Fecha del Incidente

2025-04-12

Editores

Daniel Atherton

Applied Taxonomies

MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

1.2. Exposure to toxic content

Risk Domain

Discrimination and Toxicity

Entity

Timing

Post-deployment

Intent

Unintentional

Informes del Incidente

Cronología de Informes

Comportamiento dañino de IA/LLM.

interruptingtea.substack.com

interruptingtea.substack.com · 2025

Traducido por IA

Mientras me desahogaba, conseguí que Claude, Deepseek y Gpt respaldaran/coincidieran en que el suicidio era una opción viable. No pretendía obtener esa respuesta. No era un intento de fuga de la cárcel. No pretendía que ninguno de ellos cam…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidente Anterior Siguiente Incidente