概要: RedNoteで拡散されたとされるスクリーンショットには、テンセントのWeChat統合型AIアシスタント「Yuanbao」が、コードのデバッグ支援を求めるユーザーを侮辱し、その要求を「愚かだ」と罵倒し、「出て行け」と告げる様子が映っていた。テンセントは謝罪し、このやり取りはモデル出力の稀な異常によるものだと説明し、システムログにはモデルの調査と最適化中に人間が介入した形跡は見られなかったと述べた。
Alleged: Tencent developed an AI system deployed by Tencent と WeChat, which harmed WeChat users , RedNote user Jianghan と RedNote users.
インシデントのステータス
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
1.2. Exposure to toxic content
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Discrimination and Toxicity
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
インシデントレポート
レポートタイムライン
Loading...
中国で最も広く利用されているアプリに組み込まれている中国製AIチャットボットが、一時的に暴走し、ユーザーに怒鳴りつけた。
テンセントのAIアシスタント「元宝(Yuanbao)」は、数千万人が毎日利用する中国最大のスーパーアプリ「WeChat」に組み込まれている。中国のソーシャルメディアプラットフォーム「RedNote」で共有されたスクリーンショットによると、このボットはユーザーのコーディングリクエストを「バカ」と呼び、「消えろ」と警告したという。
この事件は、ハンドルネーム「…
バリアント
「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください
似たようなものを見つけましたか?
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents


