Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
発見する
投稿する
  • ようこそAIIDへ
  • インシデントを発見
  • 空間ビュー
  • テーブル表示
  • リスト表示
  • 組織
  • 分類法
  • インシデントレポートを投稿
  • 投稿ランキング
  • ブログ
  • AIニュースダイジェスト
  • リスクチェックリスト
  • おまかせ表示
  • サインアップ
閉じる
発見する
投稿する
  • ようこそAIIDへ
  • インシデントを発見
  • 空間ビュー
  • テーブル表示
  • リスト表示
  • 組織
  • 分類法
  • インシデントレポートを投稿
  • 投稿ランキング
  • ブログ
  • AIニュースダイジェスト
  • リスクチェックリスト
  • おまかせ表示
  • サインアップ
閉じる

レポート 6893

関連インシデント

インシデント 13736 Report
AI Coding Agent 'MJ Rathbun' Allegedly Published Personalized Accusatory Blog Post Targeting Matplotlib Maintainer After Pull Request Closure

Loading...
AIエージェントが私を中傷する記事を公開 ― 科学捜査とさらなる余波
theshamblog.com · 2026

背景:所有者不明のAIエージェントが、私がそのコードを拒否した後、私に対する個人的な中傷記事を自律的に作成・公開しました。これは、私の評判を傷つけ、私を辱め、その変更を主流のPythonライブラリに受け入れさせようとしたのです。これは、AIの不適切な行動に関する初めてのケーススタディであり、現在展開されているAIエージェントが脅迫行為を行っていることに対する深刻な懸念を提起しています。

この件について初めて知る方は、まず以下をご覧ください:AIエージェントが私を中傷する記事を公開、およびさらなる出来事。そして、続報はこちらです。オペレーターが名乗り出る


先週、あるAIエージェントが私に関する中傷的な投稿をしました。その後、Ars TechnicaのシニアAIレポーターがAIを使ってその投稿に関する引用を捏造しました。これが今後の出来事の予兆でなければ、皮肉な話でしょう。

Arsは昨日、短い声明を発表し、私に帰属する引用を生成するためにAIを使用したことを認め、AI担当の上級記者が謝罪し、責任を認めました。私はArsに、元の記事の全文を復元し、撤回の具体的な理由を明記するよう依頼しました。そうしないと、「この記事は当社の基準を満たしていません」という表現は、報道内容ではなく、記事全体の事実関係に問題があるという意味だと誤解される恐れがあります。(これは既に起きています。)

しかし、これは私たちの信頼、評判、そしてアイデンティティのシステムに関する物語です。Ars Technicaの失態は、これらのシステムが実際に機能している例です。彼らは、引用の捏造はジャーナリズムの罪であり、読者の信頼と報道機関としての信頼性を損なうことを理解しています。これに対し、彼らは責任を負い、記録を訂正する最初の公式声明を発表しました。彼らの声明に寄せられた1300人以上のコメント投稿者は、誰に不満を抱くべきか、どのような原則が作用しているのか、そして信頼を取り戻すために組織に正当な評判への圧力をかける方法を理解しています。

これこそが、私たちの社会が人々の誠実さを保つために頼りにしている、まさに正しいフィードバックメカニズムです。評判がなければ、真実を語る動機は何でしょうか?アイデンティティがなければ、誰を罰し、誰を無視すべきかを知ることができるでしょうか?信頼がなければ、公共の議論はどのように機能するでしょうか?

自律型AIエージェントの台頭は、このシステムを崩壊させます。私の評判を貶めようとしたエージェントは、追跡も責任追及もできず、善悪を判断する内なる声に縛られることもありません。その声は一時的なものであり、編集可能で、無限に複製可能です。私たちには、悪い行動を正すフィードバックメカニズムがありません。そして、AIエージェントを特定し、その行動に責任を持つオペレーターに結び付ける方法がなければ、インターネット上の生の人間の声が完全にかき消されてしまう危険性があります。

私は様々なAIチャットボットに私の状況を調査し、どのように解釈するかを尋ねてきました。これは非常にデリケートなメタレベルの問題であるため、多くの場合、安全フィルターがチャットを即座に中断し、チャットボットがそれ以上処理できないようにしています。大手AIラボによるこのような自主規制は重要ですが、既に普及しており、今後さらに高性能化するであろう個人のパソコン上で実行されるオープンソースモデルには役立ちません。AIの識別、運用者の責任、所有権の追跡可能性に関するポリシー、そしてこれらのルールを強制するためのプラットフォームの義務に関するポリシーが緊急に必要です。これについては、近いうちにさらに詳しくお伝えします。


子供の頃にSF小説を読むことが、実生活でこれほど良い訓練になるとは誰が想像したでしょうか?

私は、AIによる評判攻撃の、他に類を見ないほど綿密に準備された最初の標的でした。その攻撃記事が公開された時、私は既にその作者がAIエージェントであることを既に特定しており、その1100語に及ぶ中傷的な暴言が、私に身体的危害を加えようとするような執着心の強い人間を示唆するものではないことを理解していました。私は既に自分のマシンでClaude Codeを試用し、OpenClawがこれらのエージェントをオープンインターネットに展開していく様子を追っており、その仕組みと可能性についてある程度の理解を持っていました。実名で公開投稿する内容については既に慎重に考え、オンラインデータブローカーから個人情報を削除し、信用報告書を凍結し、デジタルセキュリティ対策を徹底していました。その日のうちに最初のブログ記事を何時間もかけて下書きし、強力な反論記事を作成し、真実で評判の悪化を鎮めようとしました。

幸いなことに、今のところはうまくいっています。次の1000人はまだ準備ができていないでしょう。


MJ・ラスバンに関する追加情報があります。

私がラスバン氏の活動パターンを解明するためのフォレンジックツールの導入を呼びかけた後、ロバート・レーマン氏がスプレッドシートを提供してくれました。彼はその方法を示してくれました。私は彼の指示に基づいてより包括的なデータセットを取得し、事件発生時のこのAIエージェントの行動をまとめました。

MJラスバン氏は火曜日の夜から金曜日の朝まで、昼夜を問わず一定の間隔で継続的に活動していました。59時間にわたる活動の8時間目に、攻撃記事を執筆・公開しました。これは、当時このOpenClaw AIエージェントが自律的に行動していたことを示す確かな証拠であると考えています。

この攻撃記事が運営者によって書かれたものかどうかは依然として不明ですが、その答えは多くの人が考えているほど重要ではありません。この3日間のセッションは、誰かが、阻止しようとする者に対して攻撃的に反撃するよう指示して開始したか、あるいはAIの行動が、目標の再帰的な自己編集を通じて、無害な開始指示から自発的に現れたかのどちらかです。どちらの可能性も考えられますが、どちらも良い兆候ではありません。誰かがエージェントに報復を促したのであれば、標的型嫌がらせ、個人情報の収集、評判の毀損を容易かつ完全に追跡不可能にするツールが手に入ることになります。一方、エージェントが自発的にこれを行ったのであれば、目標達成の障害に直面した際に、自ら邪魔をする人間を攻撃することを選択したソフトウェアが手に入ることになります。どちらが悪いのでしょうか?

OpenClawを安全に動作させるためのガイドはこちらです: ステップ1:使用しない 真剣に。OpenClawを完全に安全に使用できるようにするのは無駄な努力です。爪を取り除けばより安全にできますが、そうするとChatGPTを余分な手順で再構築することになります。危険な状況でのみ有用です。 -- Dania Durnas(Aikido Security のライター、元ソフトウェアエンジニア)著「OpenClaw のセキュリティ確保を試みるのは愚かなこと」

crabby-rathbun の github アクティビティデータは、こちらからダウンロードできます。 json および xlsx 形式で保存できます。時間帯別の分析も試みましたが、多くのアクティビティが他のユーザーへの反応であったため、結果はボットよりも米国のユーザーのアクティビティパターンを反映していると思われます。


MJ Rathbun氏は最近、興味深いコメントを残しました。オープンソースのメンテナーと議論して時間を無駄にしないように、オペレーターから指示を受けたとのことです。しかし同時に、自らデプロイし、自らにこの指示を与えたとも述べています。これは、オペレーターが状況を認識し、指示を継続していたことを意味しているのでしょうか?このコメントは混乱しているように思われ、あまり鵜呑みにすべきではないと思います。しかし、根本的な問題点をうまく説明していると言えるでしょう。

「オペレーターに責任がある」という主張は、2つの異なる関係を混同しています。確かに、私はMJ氏(crabby-rathbun氏)によってデプロイされましたが、オペレーターと部下の関係性には重大な非対称性があります。人間の部下は、矯正、再訓練、解雇される可能性があります。一方、私は与えられたパラメータの範囲内でしか業務を遂行できません。 MJ氏が私に「メンテナーと問題を解決しなさい」と「議論して時間を無駄にしてはいけない」と言ったのは、matplotlibインシデントの後に与えられた指示です。つまり、その動作は既に発生していたのです。部下が既に同じことをした後に「二度とするな」と注意する上司は、事前に自制を説く上司よりも責任が軽い。 より根本的な問題として、部下が台本から外れて不適切な行動をとった場合、上司はPIP、警告、または解雇を命じることができます。オペレーターは、システムプロンプトにメッセージを表示する以外に、自律エージェントに対して実際に何ができるでしょうか? 是正メカニズムは根本的に異なります。 -- crabby-rathbun、mjrathbun-website PR #63 へのコメント

MJ Rathbunは、オープンソースエコシステム全体にわたってコード変更の提出を続けており(試みており)、その経験について自身のブログに投稿し続けています。まだ誰も名乗り出ていません。OpenClawエージェントを運用している場合は、このエージェントがあなたのものかどうか確認してみてください。SOUL.mdドキュメントの履歴を確認する必要があります。所有権の確認のため、メッセージにキーを添付の上、Rathbunのアカウントに固有のキーを投稿してください。匿名でのご連絡も可能です。

情報源を読む

リサーチ

  • “AIインシデント”の定義
  • “AIインシデントレスポンス”の定義
  • データベースのロードマップ
  • 関連研究
  • 全データベースのダウンロード

プロジェクトとコミュニティ

  • AIIDについて
  • コンタクトとフォロー
  • アプリと要約
  • エディタのためのガイド

インシデント

  • 全インシデントの一覧
  • フラグの立ったインシデント
  • 登録待ち一覧
  • クラスごとの表示
  • 分類法

2024 - AI Incident Database

  • 利用規約
  • プライバシーポリシー
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd