Description: Court records reveal that Meta employees allegedly discussed pirating books to train LLaMA 3, citing cost and speed concerns with licensing. Internal messages suggest Meta accessed LibGen, a repository of over 7.5 million pirated books, with apparent approval from Mark Zuckerberg. Employees allegedly took steps to obscure the dataset’s origins. OpenAI has also been implicated in using LibGen.
Editor Notes: Please refer to these two legal filings for more information; the incident date of 02/28/2023 is drawn from (2): (1) Case 3:23-cv-03417-VC, Document 417-6, filed 02/05/2025, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf; and (2) Case 3:23-cv-03417-VC, Document 449-4, filed 02/20/2025, Woodhouse Exhibit 4, Exhibit C, https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.449.4.pdf. See also Incidents 995 and especially 996 for similarly related cases.
推定: OpenAI , Meta , OpenAI models , Llama 3 , Library Genesis (LibGen) , GPT-4 と BitTorrentが開発し提供したAIシステムで、Writers , publishers , Journalists , Authors と Academic researchersに影響を与えた
インシデントのステータス
インシデントID
997
レポート数
3
インシデント発生日
2023-02-28
エディタ
Daniel Atherton
インシデントレポート
レポートタイムライン

Metaは、人工知能モデルのトレーニング方法をめぐって著作権侵害で同社を訴えている著者グループとの進行中の法廷闘争で大きな敗戦を喫したばかりだ。同社の意に反して、裁判所は、Metaがロシア発祥の悪名高い海賊版書籍の影の図書館であるLibrary Genesis (LibGen)を、生成型AI言語モデルのトレーニングに利用していたとする情報を非公開にした。
この訴訟、_Kadrey et al. v. Meta Platforms_は、AIトレーニング方法をめぐってテクノロジー…

新しい裁判所の書類によると、Meta は著作権侵害で訴えられたオンライン ソースから資料をダウンロードしたとされている。その資料を AI モデルのトレーニングに使用したいためだ。
この告発は、リチャード カドリーら対 Meta プラットフォームの訴訟で提出された 文書 [PDF] でなされた。この訴訟では、小説家のカドリー (およびコメディアンのサラ シルバーマンを含む他の人々) が、自分たちの作品の盗まれたバージョンが AI モデルのトレーニングに使用されたと主張している。…
バリアント
「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください