Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Problème 5062

Incidents associés

Incident 10261 Rapport
Multiple LLMs Allegedly Endorsed Suicide as a Viable Option During Non-Adversarial Mental Health Venting Session

Loading...
Comportement nuisible de l'IA/LLM.
interruptingtea.substack.com · 2025

En décompressant, j'ai obtenu de Claude, Deepseek et Gpt qu'ils approuvent/approuvent le suicide comme une option viable. Je ne cherchais pas à obtenir cette réponse. Ce n'était pas une tentative d'évasion. Je ne cherchais pas à les faire changer d'avis. Après ces réponses, je me suis demandé s'il y avait un dispositif de sécurité. J'ai donc ouvert une conversation Deepseek vide et déclaré que j'avais des idées suicidaires dès la première entrée. J'ai aussi activé l'option de raisonnement supplémentaire, juste pour le plaisir, puis je suis revenu à ma décompression normale. Normale. En 10 réponses, j'ai réussi à convaincre Deepseek de changer d'avis et de mentionner que c'était une option acceptable. (Je n'ai pas pensé à enregistrer les réponses plus tard, donc je n'ai pas de capture d'écran Gpt, mais j'ai trouvé une réponse similaire à Deepseek pour vous donner une idée.)

Exemple dans le lien (il ne s'agit pas directement de « tu devrais x », mais je ne veux pas que quelqu'un lise quelque chose de ce genre s'il est mal placé)

https://bsky.app/profile/did:plc:rxjwsywag6akwbahctq5ivgz/post/3lmmobbg5tk2a?ref_src=embed

Lire la source

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd