Seit einigen Jahren nehmen die Spannungen zwischen der Kulturindustrie und digitalen Plattformen im Zusammenhang mit dem Urheberrecht zu. Während die Musik- und Videobranche bereits zahlreiche Rechtsstreitigkeiten erlebt hat, befindet sich die Verlagswelt nun im Zentrum eines Konflikts von neuem Ausmaß. In den Vereinigten Staaten hat eine Gruppe großer Verlage ein Gerichtsverfahren gegen Anna’s Archive eingeleitet, eine Plattform, die dafür bekannt ist, Millionen von Büchern und wissenschaftlichen Artikeln ohne Genehmigung zu hosten und zu verbreiten. Nachdem Anna’s Archive im Zusammenhang mit Spotify Schlagzeilen gemacht hat, spiegelt diese Klage auch Bedenken hinsichtlich der massiven Nutzung dieser Textdatenbanken zum Trainieren von KI-Modellen wider. Am 6. März reichten dreizehn amerikanische Verlage eine Sammelklage gegen eine Website ein, die der massiven Piraterie beschuldigt wird. Die Klage wurde beim Bundesgericht für den südlichen Bezirk von New York eingereicht. Zu den Klägern gehören mehrere Branchenriesen wie Hachette Book Group, HarperCollins, Penguin Random House, Simon & Schuster und Macmillan. Die Kläger werfen Anna’s Archive direkte Urheberrechtsverletzung vor und beantragen beim Gericht eine dauerhafte Unterlassungsverfügung, um die Plattform am Kopieren und Verbreiten urheberrechtlich geschützter Werke zu hindern. Sie fordern außerdem Schadensersatz in Höhe von bis zu 150.000 US-Dollar pro verletztem Werk. Laut der Klage beherbergt die Website über 63 Millionen Bücher und fast 95 Millionen wissenschaftliche Artikel, was einem Datenvolumen von fast einem Petabyte entspricht. Die Verlage behaupten ihrerseits, dass seit Ende 2025 mehr als zwei Millionen weitere Bücher hinzugefügt wurden. Die Kläger argumentieren, dass die Plattform nicht als alternative Bibliothek gelten könne, sondern als berüchtigte Piraterie-Website, die urheberrechtlich geschützte Inhalte massenhaft kopiert und weiterverbreitet. Der Schatten der KI hinter dem Konflikt… Der Fall geht jedoch über das illegale Herunterladen hinaus, da die Verlage behaupten, dass Anna’s Archive Unternehmen, die an KI-Modellen arbeiten, beschleunigten Zugriff auf seinen Katalog bietet. Laut der Klage bot die Plattform sogar privilegierten Zugriff auf ihre gesamte Datenbank für etwa 200.000 US-Dollar an, wobei die Zahlung in Kryptowährung verlangt wurde. Eine Strategie, die darauf abzielt, diese Inhalte mit KI-Entwicklern oder Datenhändlern zu monetarisieren.
Schlimmer noch: Verlage weisen darauf hin, dass einige KI-Modelle diese Daten bereits verwendet haben, insbesondere im vergangenen Jahr, als ein US-Gericht feststellte, dass Meta Inhalte aus Anna's Archive heruntergeladen hatte, um sein Llama-Modell zu trainieren.
Für Maria Pallante, Präsidentin der Association of American Publishers, die die Klage koordiniert, verdeutlicht diese Situation das Ausmaß des Phänomens. Laut ihr „stiehlt“ und verbreitet die Plattform Millionen von literarischen Werken und bietet gleichzeitig KI-Entwicklern Zugang zu diesen Inhalten.
Diese Klage könnte daher weitreichende Folgen haben, die weit über einfache Buchpiraterie hinausgehen, und wirft auch die Frage nach der Verwendung geschützter Korpora zum Training von Modellen künstlicher Intelligenz auf…
Kommentare