图书盗版:安娜的档案馆遭到13家大型出版商的攻击
多年来,围绕版权问题,文化产业与数字平台之间的紧张关系日益加剧。音乐和视频领域已经经历了无数次法律纠纷,而出版业如今也发现自己身处一场规模空前的冲突中心。
在美国,一群大型出版商刚刚对Anna’s Archive提起诉讼,该平台因未经授权托管和分发数百万册书籍和科学文章而臭名昭著。
继与Spotify的关联事件登上新闻头条后,此次诉讼也反映出人们对大规模使用这些文本数据库来训练人工智能模型的担忧……
针对被控大规模盗版网站的集体诉讼
3月6日,13家美国出版商提起了一项集体诉讼
原告在纽约南区联邦法院提起诉讼
。原告包括多家行业巨头,例如阿歇特图书集团、哈珀柯林斯、企鹅兰登书屋、西蒙与舒斯特和麦克米伦。原告指控Anna’s Archive直接侵犯版权,并请求法院颁布永久禁令,禁止该平台复制和传播受版权保护的作品。他们还要求对每件侵权作品赔偿最高15万美元。
根据诉状,该网站拥有超过6300万册图书和近9500万篇科学文章,数据量接近1PB。出版商方面也声称,自2025年底以来,该网站新增了超过200万册图书。原告方认为,该平台不能被视为替代图书馆,而是臭名昭著的盗版网站,大量复制和传播受版权保护的内容。
冲突背后的人工智能阴影……
然而,此案远不止非法下载那么简单,出版商声称,Anna’s Archive向从事人工智能模型研究的公司提供对其目录的快速访问。
根据诉状,该平台甚至提供对其整个数据库的特权访问权限,价格约为20万美元,并要求以加密货币支付。
一项旨在通过人工智能开发者或数据经纪商将这些内容货币化的策略。更糟糕的是,出版商指出,一些人工智能模型已经使用了这些数据,尤其是在去年,美国法院指出,Meta 从 Anna's Archive 下载内容 来训练其 Llama 模型。
对于协调此次法律诉讼的美国出版商协会主席Maria Pallante 而言,这种情况凸显了这一现象的严重性。据她称,该平台“窃取”并分发数百万部文学作品,同时还向人工智能开发者提供这些内容的访问权限。
因此,此次法律诉讼的影响可能远不止于简单的书籍盗版,而且还引发了使用受保护语料库训练人工智能模型的问题……
请 登录 发表评论。
评论