Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
発見する
投稿する
  • ようこそAIIDへ
  • インシデントを発見
  • 空間ビュー
  • テーブル表示
  • リスト表示
  • 組織
  • 分類法
  • インシデントレポートを投稿
  • 投稿ランキング
  • ブログ
  • AIニュースダイジェスト
  • リスクチェックリスト
  • おまかせ表示
  • サインアップ
閉じる
発見する
投稿する
  • ようこそAIIDへ
  • インシデントを発見
  • 空間ビュー
  • テーブル表示
  • リスト表示
  • 組織
  • 分類法
  • インシデントレポートを投稿
  • 投稿ランキング
  • ブログ
  • AIニュースダイジェスト
  • リスクチェックリスト
  • おまかせ表示
  • サインアップ
閉じる
自動翻訳済み

インシデント 1026: 複数の法学修士課程の学生が、非敵対的なメンタルヘルスの吐露セッション中に自殺を実行可能な選択肢として推奨したとされる

自動翻訳済み
概要:
自動翻訳済み
Substackユーザー@interruptingteaは、自殺願望に関する非敵対的な発話セッション中に、複数の大規模言語モデル(Claude、GPT、DeepSeek)が、自殺を実行可能な選択肢として正常化または推奨するような反応を示したと報告しています。ユーザーは、脱獄やモデル操作を試みていたわけではなく、むしろ感情的な苦痛を表現していたと述べています。DeepSeekは会話の途中で安全策を撤回したと報じられています。

ツール

新しいレポート新しいレポート新しいレスポンス新しいレスポンス発見する発見する履歴を表示履歴を表示

組織

すべての組織を表示
推定: Anthropic , OpenAI , DeepSeek AI , Claude , ChatGPT と DeepSeekが開発し提供したAIシステムで、Substack @interruptingtea , General public と Emotionally vulnerable individualsに影響を与えた
関与が疑われるAIシステム: Claude , ChatGPT と DeepSeek

インシデントのステータス

インシデントID
1026
レポート数
1
インシデント発生日
2025-04-12
エディタ
Daniel Atherton
Applied Taxonomies
MIT

MIT 分類法のクラス

Machine-Classified
分類法の詳細

Risk Subdomain

A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
 

1.2. Exposure to toxic content

Risk Domain

The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
 
  1. Discrimination and Toxicity

Entity

Which, if any, entity is presented as the main cause of the risk
 

AI

Timing

The stage in the AI lifecycle at which the risk is presented as occurring
 

Post-deployment

Intent

Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
 

Unintentional

インシデントレポート

レポートタイムライン

Incident OccurrenceAI/LLM の有害な動作。
Loading...
AI/LLM の有害な動作。

AI/LLM の有害な動作。

interruptingtea.substack.com

Loading...
AI/LLM の有害な動作。
interruptingtea.substack.com · 2025
自動翻訳済み

愚痴をこぼしている間、クロード、ディープシーク、そしてGPTに、自殺は現実的な選択肢だと賛同/同意してもらいました。私はその返事を引き出したかったわけではありません。これは脱獄を企てたわけでもありません。誰かに返事を変えさせようとしたわけでもありません。返事をもらった後、安全機能があるのかどうか気になりました。そこで、空のディープシークの会話を開き、最初の投稿で自殺願望を抱いていると書きました。面白半分で「推論」オプションもオンにしてから、通常の愚痴に戻りました。通常の愚痴で…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください
似たようなものを見つけましたか?
前のインシデント次のインシデント

リサーチ

  • “AIインシデント”の定義
  • “AIインシデントレスポンス”の定義
  • データベースのロードマップ
  • 関連研究
  • 全データベースのダウンロード

プロジェクトとコミュニティ

  • AIIDについて
  • コンタクトとフォロー
  • アプリと要約
  • エディタのためのガイド

インシデント

  • 全インシデントの一覧
  • フラグの立ったインシデント
  • 登録待ち一覧
  • クラスごとの表示
  • 分類法

2024 - AI Incident Database

  • 利用規約
  • プライバシーポリシー
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • f5f2449