組織

私たちは、正当なユーザーにとっての有用性を維持しながら、敵対的なアクターによるClaudeモデルの悪用を防ぐことに尽力しています。私たちの安全対策は多くの有害な出力を効果的に防いでいますが、脅威アクターはこれらの保護を回避する方法を模索し続けています。私たちは、得られた知見を活用して、安全対策を継続的に強化しています。

本レポートでは、アクターによるモデル悪用事例と、そのような悪用を検出・対策するために私たちが講じてきた対策について、いくつかのケーススタディを概説しています。…

blog.securitybreak.io · 2025

自動翻訳済み

LLMと生成AIシステムは業界を問わず急速に導入されており、その規模は脅威アクターにとって新たな機会を生み出しています。

最近、Anthropicの脅威レポートで、AIモデルClaudeの悪用について議論されました。レポートは非常に興味深いものですが、脅威アナリストにとって真に価値のある、重要な実用的な洞察が欠けています（私見ですが🤓）。とはいえ、彼らの素晴らしい取り組みが損なわれるわけではありません。

そこで、この問題を修正し、このレポートを今すぐ活用できる実用的なインテ…

クロードAIが100人以上の偽政治家を操り、世界的な影響力拡大キャンペーンを展開

thehackernews.com · 2025

自動翻訳済み

人工知能（AI）企業Anthropicは、未知の脅威アクターが同社のClaudeチャットボットを活用し、「サービスとしての影響力」作戦でFacebookとXの正規アカウントに接触していたことを明らかにした。

金銭目的とされるこの高度な活動では、同社のAIツールを使用して2つのソーシャルメディアプラットフォームで100の異なるペルソナを編成し、「政治的に連携したアカウント」のネットワークを構築し、「数万」の正規アカウントと接触していたとされている。

Anthropicの研究者に…

channele2e.com · 2025

自動翻訳済み

The Hacker News の報道によると、Anthropic は AI ツールが影響力拡大のためにどのように武器化されるかを示す懸念すべき事例を明らかにした。同社は、自社の Claude チャットボットが Facebook と X 上で政治的なテーマのペルソナのネットワークを作成・管理するために使用されていたことを発見した。これらのペルソナは、実際のユーザーとやり取りし、UAE、イラン、ケニア、一部のヨーロッパ諸国などの国の利益に沿ったストーリーを拡散するように設計され…

gbhackers.com · 2025

自動翻訳済み

Anthropic社が開発したClaude AIは、様々な敵対的活動において悪意のある攻撃者によって悪用されてきました。特に金銭目的の「サービスとしての影響力」キャンペーンが有名です。

この活動では、Claudeの高度な言語機能を活用し、Twitter/XやFacebookなどのプラットフォームで100を超えるソーシャルメディアボットアカウントを管理し、世界中の数万人のユーザーと交流しました。

このAIを技術的に特徴づけるのは、Claudeがオーケストレーターとしての役割を担…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

似たようなものを見つけましたか？

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

AI-Generated Profiles Used in Disinformation Campaign Targeting Ukrainians

インシデント 1054: アントロピックの報告書は、クロードの不正利用による影響力操作、クレデンシャルスタッフィング、採用詐欺、マルウェア開発を明らかにした。

ツール

組織

インシデントのステータス

インシデントレポート

レポートタイムライン

クロードの悪意ある利用の検出と対策：2025年3月

プロンプトが予想外の新しい IOC である理由

クロードAIが100人以上の偽政治家を操り、世界的な影響力拡大キャンペーンを展開

アントロピックがAI主導の影響力とサイバー犯罪活動にフラグを立てる

クロード AI がサービスとしての影響力の運用とキャンペーンで悪用される

クロードの悪意ある利用の検出と対策：2025年3月

プロンプトが予想外の新しい IOC である理由

クロードAIが100人以上の偽政治家を操り、世界的な影響力拡大キャンペーンを展開

アントロピックがAI主導の影響力とサイバー犯罪活動にフラグを立てる

クロード AI がサービスとしての影響力の運用とキャンペーンで悪用される

バリアント

よく似たインシデント

テキスト類似度による

AI-Generated Profiles Used in Disinformation Campaign Targeting Ukrainians

Fake LinkedIn Profiles Created Using GAN Photos

DALL-E 2 Reported for Gender and Racially Biased Outputs

よく似たインシデント

テキスト類似度による

AI-Generated Profiles Used in Disinformation Campaign Targeting Ukrainians

Fake LinkedIn Profiles Created Using GAN Photos

DALL-E 2 Reported for Gender and Racially Biased Outputs