インシデント 855: 名誉毀損訴訟に関係する名前が、ChatGPTの名前認識におけるフィルタリングエラーを引き起こしているとの報道

概要:

ChatGPTは、特定の個人に関する潜在的に有害または中傷的なコンテンツの生成を防ぐために設計されたハードコードされたフィルターが原因で、エラーやサービスの中断が発生していると報告されています。これらのフィルターは、トレーニング後の介入に関連する可能性のある特定の名前を含むプロンプトをブロックすることで、特定の個人に関する潜在的に有害または中傷的なコンテンツの生成を防ぎます。報告されている名前は、ブライアン・フッド、ジョナサン・ターリー、ジョナサン・ジットレイン、デビッド・フェイバー、デビッド・メイヤー、グイド・スコルザです。

Editor Notes: For the reference to Jonathan Turley, see Incident 506; for Brian Hood, see Incident 507. This incident also presents potential adversarial vulnerabilities, as well as unintended consequences for users sharing affected names.

ツール

新しいレポート新しいレスポンス発見する履歴を表示

組織

すべての組織を表示

Alleged: OpenAI と ChatGPT developed an AI system deployed by OpenAI と ChatGPT users, which harmed ChatGPT users , Jonathan Zittrain , Jonathan Turley , Guido Scorza , David Mayer , David Faber と Brian Hood.

インシデントのステータス

インシデントID

855

レポート数

インシデント発生日

2024-11-30

エディタ

Daniel Atherton

Applied Taxonomies

MIT

MIT 分類法のクラス

Machine-Classified

分類法の詳細

Risk Subdomain

7.3. Lack of capability or robustness

Risk Domain

AI system safety, failures, and limitations

Entity

Timing

Post-deployment

Intent

Unintentional

インシデントレポート

レポートタイムライン

特定の名前はChatGPTを停止させますが、その理由はわかっています

arstechnica.com

ChatGPT はなぜこの亡くなった教授の名前を言わないのでしょうか?

nytimes.com

ChatGPT が「David Mayer」という名前を言えなかった理由の謎

wsj.com

arstechnica.com · 2024

自動翻訳済み

OpenAI の ChatGPT は、単なる派手なインターフェースを備えた AI 言語モデルではありません。これは、AI モデルとコンテンツフィルターのスタックで構成されたシステムであり、その出力によって OpenAI が恥ずかしい思いをしたり、ボットが人に関する潜在的に有害な事実をでっち上げ場合に同社が法的トラブルに巻き込まれたりしないようにします。

最近、この事実がニュースになりました。人々が発見した「David Mayer」という名前がChatGPTを破綻させると…

nytimes.com · 2024

自動翻訳済み

イギリスのマンチェスターに住む演劇教授のデイビッド・メイヤー氏は、人生の最後の数年間、不幸な偶然の連鎖的な結果に直面した。テロ監視リストに載っていたチェチェンの反乱軍の死者が、かつてメイヤー氏の名前を偽名として使っていたのだ。

家族によると、本物のメイヤー氏は旅行計画を妨害され、金融取引は凍結され、重要な学術通信はブロックされた。そのフラストレーションは、2023年に94歳で亡くなるまで彼を悩ませた。

しかし今月、彼のアイデンティティーを守る闘いが再び注目を集めた。鋭い目を持…

wsj.com · 2024

自動翻訳済み

デビッド・メイヤーは先週まで特に有名な名前ではなかったが、インターネットで注目を浴びるようになった。その理由はデビッド・メイヤーという人物の発言や行動ではなく、生成AIチャットボットChatGPTがその名前の言及を扱った方法にあった。

ChatGPTに「デビッド・メイヤーって誰？」と尋ねたユーザーは、チャットボットが質問に答えている途中で応答を放棄し、それまでに入力されたテキストをすべて削除して「応答できません」というエラーメッセージを表示したことに驚いた。

この謎のニュース…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？