banner
Nachrichtenzentrum
Unsere gemeinsamen Anstrengungen werden zu einem zufriedenstellenden Ergebnis führen.

KI-Klagen erklärt: Wer wird verklagt?

May 15, 2024

Getty Images/iStockphoto

Viele Menschen sind der Meinung, dass es an der Zeit ist, dass KI-Unternehmen für die kostenlosen Datenessen bezahlen, die ihre generativen Systeme groß und stark gemacht haben.

Vor kurzem wurden in den USA und Europa zahlreiche Klagen eingereicht, die Schadensersatz von KI-Unternehmen fordern. Zu den Klägern gehören Autoren und Künstler, die immer wieder Bedenken geäußert haben, dass KI ihre Werke stehlen und mittelmäßige Derivate produzieren könnte.

Ein offener Brief der Authors Guild – unterzeichnet von mehr als 8.500 Autoren, darunter Margaret Atwood, Dan Brown und Jodi Picoult – fordert Technologieunternehmen, die für generative KI-Anwendungen verantwortlich sind, wie ChatGPT und Bard, auf, ihre Werke nicht mehr ohne entsprechende Genehmigung zu verwenden oder Entschädigung. Die Autoren wollen, dass Unternehmen für die Daten bezahlen, die sie für das Training gesammelt haben – die „Nahrung“ für KI-Systeme, endlose Mahlzeiten, für die es keine Rechnung gab.

Autoren äußern auch ihre Besorgnis darüber, dass generative KI ihren Beruf bedroht, indem sie den Markt mit maschinengeschriebenen Inhalten überschwemmt, die auf ihrer Arbeit basieren. Dies war in den letzten Monaten ein Problem, als Amazon gegen KI-Autoren vorging, die die Bestsellerliste mit generierten Werken zuspammten.

Vor der Veröffentlichung des Briefes der Authors Guild reichten zwei nordamerikanische Autoren – Mona Awad und Paul Tremblay – eine Klage gegen OpenAI ein und behaupteten, die Organisation habe gegen das Urheberrecht verstoßen. In der Klage wurde argumentiert, dass OpenAI gegen das Urheberrecht verstoßen habe, weil ChatGPT genaue Zusammenfassungen der Werke des Autors erstellt habe und daher an den Werken des Autors geschult worden sein müsse.

Sie sind nicht die Einzigen. Auch die Autorin und Komikerin Sarah Silverman verklagt OpenAI und Meta wegen der illegalen Reproduktion ihrer Memoiren „The Bedwetter“ ohne Erlaubnis. Aufgrund der Funktionsweise der generativen KI kann dieses Argument jedoch vor Gericht nicht Bestand haben.

Generative KI ist die Technologie, die ChatGPT und Bard antreibt. Textbasierte generative KI verwendet Algorithmen, um die wahrscheinlich nächsten Wörter im Text vorherzusagen, und generiert diesen Text basierend auf einer Eingabeaufforderung des Benutzers. ChatGPT weiß, was generiert werden soll, da es auf einer großen Menge öffentlich verfügbarer Daten aus dem Internet trainiert wurde. Es lernte Muster aus dem Training und ordnet diese Muster den Eingabeaufforderungen des Benutzers zu.

Generative KIs sind in der Regel Black-Box-KI-Systeme, was bedeutet, dass niemand – nicht einmal die Programmierer – die genauen Schritte versteht, die die Maschine unternimmt, um von der Eingabe zur Ausgabe zu gelangen. Der Input geht rein, die Magie geschieht und der Output kommt raus.

Alle Tools für maschinelles Lernen und generative KI nutzen bereits vorhandene Werke irgendeiner Art.

Menschen verklagen KI-Unternehmen wegen Urheberrechten. Obwohl ChatGPT auf Daten aus dem Internet basiert, geschieht dies ohne Erlaubnis der Datenersteller. GPT-3 wurde beispielsweise unter anderem auf Wikipedia und Reddit trainiert. Das Schulungsmaterial könnte jedoch Gespräche über und Segmente urheberrechtlich geschützter Werke enthalten und großen Sprachmodellen genügend Kontext bieten, um diese urheberrechtlich geschützten Werke genau zusammenzufassen.

In größerem Maßstab klagen die Leute, weil KI eine Blackbox ist und es unmöglich ist, zu wissen, wie sie auf granularer Ebene funktioniert. Es besteht die Befürchtung, dass Menschen KI nutzen, um sich der Verantwortung für ihre Entscheidungen oder die von ihr hervorgebrachten Dinge zu entziehen.

„Wenn es KI-Unternehmen gestattet wird, KI-Systeme zu vermarkten, bei denen es sich im Wesentlichen um Black Boxes handelt, könnten sie zu ultimativen Geräten werden, bei denen der Zweck die Mittel rechtfertigt“, schrieb Matthew Butterick, einer der Anwälte hinter mehreren Klagen, in seinem Blog. „In absehbarer Zeit werden wir Entscheidungen nicht an KI-Systeme delegieren, weil diese eine bessere Leistung erbringen. Vielmehr werden wir Entscheidungen an KI-Systeme delegieren, weil sie mit allem durchkommen, was wir nicht können.“

Gegen generative KI-Unternehmen wurden zahlreiche Klagen wegen Urheberrecht und Missbrauch eingereicht. Hier sind einige der Unternehmen, die verklagt werden.

Gegen diese Unternehmen wurde eine Sammelklage im Zusammenhang mit dem Copilot-Tool von GitHub eingereicht. Das Tool generiert vorausschauend Code basierend auf dem, was der Programmierer bereits geschrieben hat. Die Kläger behaupten, dass Copilot Code von GitHub kopiert und erneut veröffentlicht, ohne sich an die Anforderungen der Open-Source-Lizenz von GitHub zu halten, beispielsweise ohne Angabe einer Quellenangabe. Die Beschwerde umfasst auch Behauptungen im Zusammenhang mit der missbräuchlichen Handhabung personenbezogener Daten und Informationen durch GitHub sowie Behauptungen wegen Betrugs. Die Klage wurde im November 2022 eingereicht. Microsoft und GitHub haben wiederholt versucht, die Klage abzuweisen.

Im Januar 2023 wurde eine Beschwerde gegen diese Anbieter von KI-Bildgeneratoren eingereicht. Die Kläger behaupteten, dass die Systeme direkt die Urheberrechte der Kläger verletzten, indem sie auf von den Klägern erstellte Werke trainierten und nicht autorisierte abgeleitete Werke erstellten. In der Beschwerde wird auch beanstandet, dass mit den Werkzeugen Arbeiten im Stil von Künstlern generiert werden können. Der Richter in diesem Fall, William Orrick, sagte, er sei geneigt, die Klage abzuweisen.

Im Januar 2023 reichte Getty Images eine Beschwerde gegen Stability AI ein, weil angeblich Millionen von Bildern und zugehörigen Metadaten im Besitz von Getty im Vereinigten Königreich kopiert und verarbeitet wurden. Tage später reichte Getty beim US-Bezirksgericht für den Bezirk Delaware eine weitere Klage gegen Stability AI ein erhob zahlreiche urheberrechtliche und markenrechtliche Ansprüche und verwies auf „bizarr oder grotesk“ erzeugte Bilder, die das Wasserzeichen von Getty Images enthielten und somit den Ruf von Getty schädigten.

Die Autoren Paul Tremblay und Mona Awad verklagen OpenAI wegen angeblicher Verletzung der Urheberrechte der Autoren. Butterick ist einer der Anwälte, die die Autoren vertreten. In der Beschwerde wurde geschätzt, dass mehr als 300.000 Bücher in die Trainingsdaten von OpenAI kopiert wurden. Die Klage zielt auf einen nicht näher bezeichneten Geldbetrag ab. Die Klage wurde im Juni 2023 eingereicht.

Sarah Silvermans Klage gegen Meta und OpenAI behauptete eine Urheberrechtsverletzung und sagte, ChatGPT und Large Language Model Meta AI (Llama) seien auf illegal erworbene Datensätze trainiert worden, in denen ihre Arbeit enthalten sei. In der Klage wird behauptet, dass die Bücher von Schattenbibliotheken wie Library Genesis, Z-Library und Bibliotek erworben wurden, wo die Bücher per Torrent heruntergeladen werden können. Torrenting ist eine gängige Methode zum Herunterladen von Dateien ohne entsprechende gesetzliche Genehmigung. Konkret wurde das Sprachmodell von Meta, Llama, anhand eines Datensatzes namens „Pie“ trainiert, der Daten von Bibliotek nutzt, heißt es in einem Papier von EleutherAI, dem Unternehmen, das den Pile zusammengestellt hat. Die Klage wurde im Juli 2023 eingereicht.

Gegen Google wird eine Sammelklage wegen angeblichen Missbrauchs personenbezogener Daten und Urheberrechtsverletzung eingereicht. Zu den in der Klage genannten Daten gehören unter anderem Fotos von Dating-Websites, Spotify-Playlists, TikTok-Videos und Bücher, mit denen Bard trainiert wurde. In der im Juli 2023 eingereichten Klage hieß es, Google könne mindestens 5 Milliarden US-Dollar schulden. Die Kläger haben sich dafür entschieden, anonym zu bleiben.

Diese Urheberrechtsverfahren gegen große Technologieunternehmen sind nicht die ersten ihrer Art. Im Jahr 2015 verklagte die Author's Guild Google, weil das Unternehmen digitale Kopien von Millionen Büchern angefertigt und Ausschnitte davon der Öffentlichkeit zugänglich gemacht hatte. Das Gericht gab letztlich Google den Vorzug, da die Werke transformativ seien und keinen Marktersatz für die Bücher darstellten.

Die oben genannten Klagen werden für die Beantwortung der folgenden Fragen wichtig sein:

Während die Fälle immer mehr Gestalt annehmen und Antworten auftauchen, sollten Unternehmen, die mit generativen KI-Tools zu tun haben, auf Orientierungshilfen rund um die Schnittstelle zwischen KI und geistigem Eigentum achten und prüfen, ob sie Strategien zur Risikominderung benötigen.