インシデントのステータス
インシデントレポート
レポートタイムライン
私たちは、正当なユーザーにとっての有用性を維持しながら、敵対的なアクターによるClaudeモデルの悪用を防ぐことに尽力しています。私たちの安全対策は多くの有害な出力を効果的に防いでいますが、脅威アクターはこれらの保護を回避する方法を模索し続けています。私たちは、得られた知見を活用して、安全対策を継続的に強化しています。
本レポートでは、アクターによるモデル悪用事例と、そのような悪用を検出・対策するために私たちが講じてきた対策について、いくつかのケーススタディを概説しています。…
人工知能(AI)企業Anthropicは、未知の脅威アクターが同社のClaudeチャットボットを活用し、「サービスとしての影響力」作戦でFacebookとXの正規アカウントに接触していたことを明らかにした。
金銭目的とされるこの高度な活動では、同社のAIツールを使用して2つのソーシャルメディアプラットフォームで100の異なるペルソナを編成し、「政治的に連携したアカウント」のネットワークを構築し、「数万」の正規アカウントと接触していたとされている。
Anthropicの研究者に…
The Hacker News の報道によると、Anthropic は AI ツールが影響力拡大のためにどのように武器化されるかを示す懸念すべき事例を明らかにした。同社は、自社の Claude チャットボットが Facebook と X 上で政治的なテーマのペルソナのネットワークを作成・管理するために使用されていたことを発見した。これらのペルソナは、実際のユーザーとやり取りし、UAE、イラン、ケニア、一部のヨーロッパ諸国などの国の利益に沿ったストーリーを拡散するように設計され…
バリアン ト
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents