Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
発見する
投稿する
  • ようこそAIIDへ
  • インシデントを発見
  • 空間ビュー
  • テーブル表示
  • リスト表示
  • 組織
  • 分類法
  • インシデントレポートを投稿
  • 投稿ランキング
  • ブログ
  • AIニュースダイジェスト
  • リスクチェックリスト
  • おまかせ表示
  • サインアップ
閉じる
発見する
投稿する
  • ようこそAIIDへ
  • インシデントを発見
  • 空間ビュー
  • テーブル表示
  • リスト表示
  • 組織
  • 分類法
  • インシデントレポートを投稿
  • 投稿ランキング
  • ブログ
  • AIニュースダイジェスト
  • リスクチェックリスト
  • おまかせ表示
  • サインアップ
閉じる

インシデント 1001: LLM Scrapers Allegedly Target Multiple Open Source Projects Disrupting the FOSS Ecosystem

概要: In mid-March 2025, KDE’s GitLab infrastructure was disrupted by aggressive AI web scrapers originating from Alibaba IP ranges. These bots ignored robots.txt and spoofed browser headers, which in turn overwhelmed the site and caused outages for developers. Similar incidents affected other FOSS projects like GNOME, SourceHut, and Fedora. The scraping is tied to large language model training, and reportedly imposes real costs and delays.

ツール

新しいレポート新しいレポート新しいレスポンス新しいレスポンス発見する発見する履歴を表示履歴を表示

組織

すべての組織を表示
推定: Alibaba , Unnamed generative AI companies , KDE , GNOME , GitLab instances , SourceHut infrastructure , Pagure.io (Fedora) , Websites hosting FOSS documentation or bug trackers , AI scrapers と Anubis proof-of-work systemsが開発し提供したAIシステムで、FOSS projects and communities , KDE , GNOME , SourceHut , Fedora , Inkscape , Curl , Linux Weekly News , Read the Docs , Diaspora と Sysadminsに影響を与えた
関与が疑われるAIシステム: KDE , GNOME , GitLab instances , SourceHut infrastructure , Pagure.io (Fedora) , Websites hosting FOSS documentation or bug trackers , AI scrapers と Anubis proof-of-work systems

インシデントのステータス

インシデントID
1001
レポート数
2
インシデント発生日
2025-03-17
エディタ
Daniel Atherton

インシデントレポート

レポートタイムライン

Incident OccurrenceFOSSインフラはAI企業による攻撃を受けているオープンソース開発者は、AIクローラーがトラフィックを支配し、国全体をブロックしていると主張
FOSSインフラはAI企業による攻撃を受けている

FOSSインフラはAI企業による攻撃を受けている

thelibre.news

オープンソース開発者は、AIクローラーがトラフィックを支配し、国全体をブロックしていると主張

オープンソース開発者は、AIクローラーがトラフィックを支配し、国全体をブロックしていると主張

arstechnica.com

FOSSインフラはAI企業による攻撃を受けている
thelibre.news · 2025
自動翻訳済み

3 日前、SourceHut の創設者兼 CEO である Drew DeVault 氏は、「コストを私に直接押し付けるのはやめてください」というブログ記事を公開し、その中で、LLM 企業が robosts.txt を尊重せずにデータをクロールし、SourceHut に深刻な障害を引き起こしていると不満を述べました。

私は「面白い!」と言い、先に進みました。

そして、昨日の朝、KDE GitLab インフラストラクチャが Alibaba の範囲の IP を持つ別の AI クロ…

オープンソース開発者は、AIクローラーがトラフィックを支配し、国全体をブロックしていると主張
arstechnica.com · 2025
自動翻訳済み

ソフトウェア開発者の Xe Iaso 氏は、今年初めに Amazon からの攻撃的な AI クローラー トラフィックが Git リポジトリ サービスを圧倒し、不安定性とダウンタイムを繰り返し引き起こしたため、限界点に達しました。robots.txt の調整、既知のクローラー ユーザー エージェントのブロック、疑わしいトラフィックのフィルタリングなど、標準的な防御策を講じたにもかかわらず、Iaso 氏は AI クローラーがユーザー エージェントを偽装し、プロキシとして住宅 IP…

バリアント

「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

Wikipedia Vandalism Prevention Bot Loop

Danger, danger! 10 alarming examples of AI gone wild

Feb 2017 · 6 レポート
Game AI System Produces Imbalanced Game

6 goof-ups that show AI is still in its diapers

Jun 2016 · 11 レポート
Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 レポート
前のインシデント次のインシデント

よく似たインシデント

テキスト類似度による

Did our AI mess up? Flag the unrelated incidents

Wikipedia Vandalism Prevention Bot Loop

Danger, danger! 10 alarming examples of AI gone wild

Feb 2017 · 6 レポート
Game AI System Produces Imbalanced Game

6 goof-ups that show AI is still in its diapers

Jun 2016 · 11 レポート
Biased Sentiment Analysis

Google's sentiment analysis API is just as biased as humans

Oct 2017 · 7 レポート

リサーチ

  • “AIインシデント”の定義
  • “AIインシデントレスポンス”の定義
  • データベースのロードマップ
  • 関連研究
  • 全データベースのダウンロード

プロジェクトとコミュニティ

  • AIIDについて
  • コンタクトとフォロー
  • アプリと要約
  • エディタのためのガイド

インシデント

  • 全インシデントの一覧
  • フラグの立ったインシデント
  • 登録待ち一覧
  • クラスごとの表示
  • 分類法

2024 - AI Incident Database

  • 利用規約
  • プライバシーポリシー
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • 1420c8e