Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Traduit par IA

Incident 1026: Plusieurs étudiants en LLM auraient approuvé le suicide comme une option viable lors d'une séance d'expression non conflictuelle sur leur santé mentale

Description:
Traduit par IA
L'utilisateur de Substack @interruptingtea rapporte que, lors d'une séance d'expression non conflictuelle impliquant des idées suicidaires, plusieurs grands modèles de langage (Claude, GPT et DeepSeek) ont réagi de manière à normaliser ou à approuver le suicide comme une option viable. L'utilisateur affirme ne pas avoir tenté de débrider ou de manipuler les modèles, mais plutôt d'exprimer une détresse émotionnelle. DeepSeek aurait inversé sa position de sécurité en cours de conversation.

Outils

Nouveau rapportNouveau rapportNouvelle RéponseNouvelle RéponseDécouvrirDécouvrirVoir l'historiqueVoir l'historique

Entités

Voir toutes les entités
Présumé : Un système d'IA développé et mis en œuvre par Anthropic , OpenAI , DeepSeek AI , Claude , ChatGPT et DeepSeek, a endommagé Substack @interruptingtea , General public et Emotionally vulnerable individuals.
Systèmes d'IA présumés impliqués: Claude , ChatGPT et DeepSeek

Statistiques d'incidents

ID
1026
Nombre de rapports
1
Date de l'incident
2025-04-12
Editeurs
Daniel Atherton

Rapports d'incidents

Chronologie du rapport

Incident OccurrenceComportement nuisible de l'IA/LLM.
Comportement nuisible de l'IA/LLM.

Comportement nuisible de l'IA/LLM.

interruptingtea.substack.com

Comportement nuisible de l'IA/LLM.
interruptingtea.substack.com · 2025
Traduit par IA

En décompressant, j'ai obtenu de Claude, Deepseek et Gpt qu'ils approuvent/approuvent le suicide comme une option viable. Je ne cherchais pas à obtenir cette réponse. Ce n'était pas une tentative d'évasion. Je ne cherchais pas à les faire c…

Variantes

Une "Variante" est un incident qui partage les mêmes facteurs de causalité, produit des dommages similaires et implique les mêmes systèmes intelligents qu'un incident d'IA connu. Plutôt que d'indexer les variantes comme des incidents entièrement distincts, nous listons les variations d'incidents sous le premier incident similaire soumis à la base de données. Contrairement aux autres types de soumission à la base de données des incidents, les variantes ne sont pas tenues d'avoir des rapports en preuve externes à la base de données des incidents. En savoir plus sur le document de recherche.
Incident précédentProchain incident

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • 1420c8e