概要: 2025年3月中旬、KDEのGitLabインフラが、AlibabaのIPアドレス範囲から発信された攻撃的なAIウェブスクレイパーによって混乱をきたしたと報じられました。これらのボットはrobots.txtを無視し、ブラウザヘッダーを偽装したとされ、その結果、サイトに過負荷がかかり、開発者に障害が発生したとされています。同様のインシデントが、GNOME、SourceHut、Fedoraといった他のFOSSプロジェクトにも影響を与えたと報告されています。このスクレイピングは大規模な言語モデルの学習に関連しているとされ、実際のコストと遅延を引き起こしているとの報告もあります。
推定: Unnamed generative AI companies , Alibaba , KDE , GNOME , Websites hosting FOSS documentation or bug trackers , SourceHut infrastructure , Pagure.io (Fedora) , GitLab instances , Anubis proof-of-work systems と AI scrapersが開発し提供したAIシステムで、Sysadmins , SourceHut , Read the Docs , Linux Weekly News , KDE , Inkscape , GNOME , FOSS projects and communities , Fedora , Diaspora と Curlに影響を与えた
インシデントのステータス
インシデントID
1001
レポート数
2
インシデント発生日
2025-03-17
エディタ
Daniel Atherton
インシデントレポート
レポートタイムライン
Loading...
Loading...

ソフトウェア開発 者の Xe Iaso 氏は、今年初めに Amazon からの攻撃的な AI クローラー トラフィックが Git リポジトリ サービスを圧倒し、不安定性とダウンタイムを繰り返し引き起こしたため、限界点に達しました。robots.txt の調整、既知のクローラー ユーザー エージェントのブロック、疑わしいトラフィックのフィルタリングなど、標準的な防御策を講じたにもかかわらず、Iaso 氏は AI クローラーがユーザー エージェントを偽装し、プロキシとして住宅 IP…
バリアント
「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください
似たようなものを見つけましたか?
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents