Kurz notiert // Urheberrecht
Landgericht München I
KI schrankenlos atemlos?! - GEMA obsiegt erstinstanzlich gegen Open AI wegen Memorisierung und originalgetreuen Outputs von Liedtexten
LG München I, Urteil vom 11.11.2025 - 42 O 14139/24
MIR 2025, Dok. 082, Rz. 1
1
Das Landgericht München I hat mit Urteil vom 11.11.2025 (42 O 14139/24) den von der GEMA gegen zwei Unternehmen der Unternehmensgruppe Open AI geltend gemachten Ansprüchen auf Unterlassung, Auskunft und Schadensersatz im Wesentlichen stattgegeben. Soweit die GEMA darüber hinaus Ansprüche auf Grund einer Verletzung des allgemeinen Persönlichkeitsrechts wegen fehlerhafter (urheberrechtlicher) Zuschreibung veränderter Liedtexte geltend gemacht hat, hat die Kammer die Klage abgewiesen.
Zur Sache
Das Verfahren betrifft die Liedtexte neun bekannter deutscher Urheberinnen und Urheber (darunter "Atemlos" von Kristina Bach oder "Wie schön, dass du geboren bist" von Rolf Zuckowski).
Die Klägerin ist eine Verwertungsgesellschaft. Zur Begründung der Klage hatte sie vorgetragen, die Liedtexte seien in den Sprachmodellen der Beklagten memorisiert und würden bei Nutzung des Chatbots auf einfache Anfragen der Nutzer als Antworten (Outputs) in weiten Teilen originalgetreu ausgegeben. Die Beklagten sind Betreiber von Sprachmodellen und darauf basierender Chatbots. Sie hatten gegen die erhobenen Ansprüche eingewandt, ihre Sprachmodelle speicherten oder kopierten keine spezifischen Trainingsdaten, sondern reflektierten in ihren Parametern, was sie basierend auf dem gesamten Trainingsdatensatz erlernt hätten. Da die Outputs nur als Folge von Eingaben von Nutzern (Prompts) generiert werden würden, seien nicht die Beklagten, sondern der jeweilige Nutzer als Hersteller des Outputs für diese verantwortlich. Ohnehin seien eventuelle Rechtseingriffe von den Schranken des Urheberrechts, insbesondere der Schranke für das sogenannten Text- und Data-Mining gedeckt.
Entscheidung des Gerichts: Memorisierung und Wiedergabe in den Outputs stellen Eingriff in die urheberrechtlichen Verwertungsrechte dar - Keine Schranken einschlägig
Nach Ansicht des LG München I stehen der Klägerin die geltend gemachten Ansprüche sowohl aufgrund der gegebenen Vervielfältigung der Texte in den Sprachmodellen als auch durch ihre Wiedergabe in den Outputs zu. Sowohl durch die Memorisierung in den Sprachmodellen als auch durch die Wiedergabe der Liedtexte in den Outputs des Chatbot lägen Eingriffe in die urheberrechtlichen Verwertungsrechte vor. Diese seien nicht durch Schrankenbestimmungen - insbesondere nicht durch die Schranke für das Text und Data Mining - gedeckt.
Memorisierung
Die streitgegenständlichen Liedtexte seien reproduzierbar in den Sprachmodellen 4 und 4o der Beklagten enthalten. Aus der informationstechnischen Forschung sei bekannt, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen. Dies werde als Memorisierung bezeichnet. Eine solche liege vor, wenn die Sprachmodelle beim Training dem Trainingsdatensatz nicht nur Informationen entnähmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten finde. Eine solche Memorisierung sei durch einen Abgleich der Liedtexte, die in den Trainingsdaten enthalten waren, mit den Wiedergaben in den Outputs festgestellt. Angesichts der Komplexität und Länge der Liedtexte sei der Zufall als Ursache für die Wiedergabe der Liedtexte ausgeschlossen.
Verkörperung gegeben
Durch die Memorisierung sei eine Verkörperung - als Voraussetzung der urheberrechtlichen Vervielfältigung der streitgegenständlichen Liedtexte durch Daten in den spezifizierten Parametern des Modells - gegeben. Die streitgegenständlichen Liedtexte seien reproduzierbar in den Modellen festgelegt. Gemäß Art. 2 InfoSoc-RL liege eine Vervielfältigung "auf jede Art und Weise und in jeder Form" vor. Die Festlegung in bloßen Wahrscheinlichkeitswerten sei hierbei unerheblich. Neue Technologien wie Sprachmodelle wären vom Vervielfältigungsrecht nach Art. 2 InfoSoc-RL und § 16 UrhG erfasst. Nach der Rechtsprechung des Unionsgerichtshofes sei für die Vervielfältigung ausreichend eine mittelbare Wahrnehmbarkeit, die gegeben sei, wenn das Werk unter Einsatz technischer Hilfsmittel wahrgenommen werden könne.
Weder durch Schrankenbestimmungen gedeckt, noch unwesentliche Beiwerk
Diese Vervielfältigung in den Modellen sei weder durch die Schrankenbestimmungen des Text und Data Mining nach § 44b UrhG noch durch § 57 UrhG als unwesentliches Beiwerk gedeckt.
Vervielfältigung von Werken beim Training ist nicht Text und Data Mining
Zwar unterfielen Sprachmodelle grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften deckten erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus für das Training, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Hintergrund hierfür sei der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt würden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigten. Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berührten, sehe das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor.
Würden beim Training - wie hier - nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stelle dies nach Auffassung der Kammer kein Text und Data Mining dar. Die Prämisse des Text und Data Mining und der diesbezüglichen Schrankenbestimmungen, dass durch die automatisierte Auswertung von bloßen Informationen selbst keine Verwertungsinteressen berührt sind, greife in dieser Konstellation nicht. Im Gegenteil, durch die gegebenen Vervielfältigungen im Modell werde in das Verwertungsrecht der Rechteinhaber eingegriffen.
Keine andere Auslegung möglich
Eine andere, mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbiete sich angesichts des klaren Wortlauts der Bestimmung. Auch eine analoge Anwendung komme nicht in Betracht. Selbst wenn man eine planwidrige Regelungslücke annehmen wollte, weil dem Gesetzgeber die Memorisierung und eine damit einhergehende dauerhafte urheberrechtlich relevante Vervielfältigung in den Modellen nicht bewusst gewesen sein sollte, mangele es an einer vergleichbaren Interessenlage. Die Schrankenregelung normiere mit der Zulässigkeit vorbereitender Vervielfältigungshandlungen beim Text und Data Mining einen Sachverhalt, bei dem die Verwertungsinteressen der Urheber nicht gefährdet seien, weil bloße Informationen extrahiert und das Werk als solches gerade nicht vervielfältigt werde. Bei Vervielfältigungen im Modell werde die Werkverwertung hingegen nachhaltig beeinträchtigt und die berechtigten Interessen der Rechteinhaber hierdurch verletzt. Die Urheber und Rechteinhaber würden durch eine analoge Anwendung der Schrankenbestimmung, die keine Vergütung für die Verwertung vorsieht, somit schutzlos gestellt. Das Risiko der Memorisierung stamme allein aus der Sphäre der Beklagten. Bei einer Analogie der Schranke würde ausschließlich der verletzte Rechteinhaber dieses Risiko tragen.
Unwesentliches Beiwerk? Kein Hauptwerk!
Mangels Vorliegens eines Hauptwerks stellten die Vervielfältigungen der streitgegenständlichen Liedtexte kein unzulässiges Beiwerk nach § 57 UrhG dar. Entgegen der Ansicht der Beklagten seien die Liedtexte nicht neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar anzusehen. Hierfür wäre erforderlich, dass es sich bei dem gesamten Trainigsdatensatz ebenfalls um ein urheberrechtlich geschütztes Werk handele.
Keine Rechtfertigung
Der Eingriff der Beklagten in die Verwertungsrechte der Klägerin sei auch nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt, da das Training von Modellen nicht als eine übliche und erwartbare Nutzungsart zu werten sei, mit der der Rechteinhaber rechnen müsse.
Wiedergabe in den Outputs rechtswidrig
Auch durch Wiedergabe der Liedtexte in den Outputs des Chatbots hätten die Beklagten nach der Entscheidung der Kammer unberechtigt die streitgegenständlichen Liedtexte vervielfältigt und öffentlich zugänglich gemacht. In den Outputs wären die originellen Elemente der Liedtexte stets wiedererkennbar.
Betreiber und nicht Nutzer verantwortlich
Hierfür seien die Beklagten und nicht die Nutzer verantwortlich. Die Outputs seien durch einfach gehaltene Prompts generiert worden. Die Beklagten betrieben die Sprachmodelle, für die die Liedtexte als Trainingsdaten ausgewählt und mit denen sie trainiert worden sind. Sie seien für die Architektur der Modelle und die Memorisierung der Trainingsdaten verantwortlich. Damit hätten die von den Beklagten betriebenen Sprachmodelle die ausgegebenen Outputs maßgeblich beeinflusst, der konkrete Inhalt der Outputs werde von den Sprachmodellen generiert.
Der Eingriff in die Verwertungsrechte durch die Outputs sei ebenfalls nicht durch eine Schrankenbestimmung gedeckt.
Das Urteil ist im Zeitpunkt der Veröffentlich nicht rechtskräftig.
(tg) - Quelle: PM Nr. 11 des LG München I vom 11.11.2025
Zur Sache
Das Verfahren betrifft die Liedtexte neun bekannter deutscher Urheberinnen und Urheber (darunter "Atemlos" von Kristina Bach oder "Wie schön, dass du geboren bist" von Rolf Zuckowski).
Die Klägerin ist eine Verwertungsgesellschaft. Zur Begründung der Klage hatte sie vorgetragen, die Liedtexte seien in den Sprachmodellen der Beklagten memorisiert und würden bei Nutzung des Chatbots auf einfache Anfragen der Nutzer als Antworten (Outputs) in weiten Teilen originalgetreu ausgegeben. Die Beklagten sind Betreiber von Sprachmodellen und darauf basierender Chatbots. Sie hatten gegen die erhobenen Ansprüche eingewandt, ihre Sprachmodelle speicherten oder kopierten keine spezifischen Trainingsdaten, sondern reflektierten in ihren Parametern, was sie basierend auf dem gesamten Trainingsdatensatz erlernt hätten. Da die Outputs nur als Folge von Eingaben von Nutzern (Prompts) generiert werden würden, seien nicht die Beklagten, sondern der jeweilige Nutzer als Hersteller des Outputs für diese verantwortlich. Ohnehin seien eventuelle Rechtseingriffe von den Schranken des Urheberrechts, insbesondere der Schranke für das sogenannten Text- und Data-Mining gedeckt.
Entscheidung des Gerichts: Memorisierung und Wiedergabe in den Outputs stellen Eingriff in die urheberrechtlichen Verwertungsrechte dar - Keine Schranken einschlägig
Nach Ansicht des LG München I stehen der Klägerin die geltend gemachten Ansprüche sowohl aufgrund der gegebenen Vervielfältigung der Texte in den Sprachmodellen als auch durch ihre Wiedergabe in den Outputs zu. Sowohl durch die Memorisierung in den Sprachmodellen als auch durch die Wiedergabe der Liedtexte in den Outputs des Chatbot lägen Eingriffe in die urheberrechtlichen Verwertungsrechte vor. Diese seien nicht durch Schrankenbestimmungen - insbesondere nicht durch die Schranke für das Text und Data Mining - gedeckt.
Memorisierung
Die streitgegenständlichen Liedtexte seien reproduzierbar in den Sprachmodellen 4 und 4o der Beklagten enthalten. Aus der informationstechnischen Forschung sei bekannt, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen. Dies werde als Memorisierung bezeichnet. Eine solche liege vor, wenn die Sprachmodelle beim Training dem Trainingsdatensatz nicht nur Informationen entnähmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten finde. Eine solche Memorisierung sei durch einen Abgleich der Liedtexte, die in den Trainingsdaten enthalten waren, mit den Wiedergaben in den Outputs festgestellt. Angesichts der Komplexität und Länge der Liedtexte sei der Zufall als Ursache für die Wiedergabe der Liedtexte ausgeschlossen.
Verkörperung gegeben
Durch die Memorisierung sei eine Verkörperung - als Voraussetzung der urheberrechtlichen Vervielfältigung der streitgegenständlichen Liedtexte durch Daten in den spezifizierten Parametern des Modells - gegeben. Die streitgegenständlichen Liedtexte seien reproduzierbar in den Modellen festgelegt. Gemäß Art. 2 InfoSoc-RL liege eine Vervielfältigung "auf jede Art und Weise und in jeder Form" vor. Die Festlegung in bloßen Wahrscheinlichkeitswerten sei hierbei unerheblich. Neue Technologien wie Sprachmodelle wären vom Vervielfältigungsrecht nach Art. 2 InfoSoc-RL und § 16 UrhG erfasst. Nach der Rechtsprechung des Unionsgerichtshofes sei für die Vervielfältigung ausreichend eine mittelbare Wahrnehmbarkeit, die gegeben sei, wenn das Werk unter Einsatz technischer Hilfsmittel wahrgenommen werden könne.
Weder durch Schrankenbestimmungen gedeckt, noch unwesentliche Beiwerk
Diese Vervielfältigung in den Modellen sei weder durch die Schrankenbestimmungen des Text und Data Mining nach § 44b UrhG noch durch § 57 UrhG als unwesentliches Beiwerk gedeckt.
Vervielfältigung von Werken beim Training ist nicht Text und Data Mining
Zwar unterfielen Sprachmodelle grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften deckten erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus für das Training, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Hintergrund hierfür sei der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt würden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigten. Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berührten, sehe das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor.
Würden beim Training - wie hier - nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stelle dies nach Auffassung der Kammer kein Text und Data Mining dar. Die Prämisse des Text und Data Mining und der diesbezüglichen Schrankenbestimmungen, dass durch die automatisierte Auswertung von bloßen Informationen selbst keine Verwertungsinteressen berührt sind, greife in dieser Konstellation nicht. Im Gegenteil, durch die gegebenen Vervielfältigungen im Modell werde in das Verwertungsrecht der Rechteinhaber eingegriffen.
Keine andere Auslegung möglich
Eine andere, mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbiete sich angesichts des klaren Wortlauts der Bestimmung. Auch eine analoge Anwendung komme nicht in Betracht. Selbst wenn man eine planwidrige Regelungslücke annehmen wollte, weil dem Gesetzgeber die Memorisierung und eine damit einhergehende dauerhafte urheberrechtlich relevante Vervielfältigung in den Modellen nicht bewusst gewesen sein sollte, mangele es an einer vergleichbaren Interessenlage. Die Schrankenregelung normiere mit der Zulässigkeit vorbereitender Vervielfältigungshandlungen beim Text und Data Mining einen Sachverhalt, bei dem die Verwertungsinteressen der Urheber nicht gefährdet seien, weil bloße Informationen extrahiert und das Werk als solches gerade nicht vervielfältigt werde. Bei Vervielfältigungen im Modell werde die Werkverwertung hingegen nachhaltig beeinträchtigt und die berechtigten Interessen der Rechteinhaber hierdurch verletzt. Die Urheber und Rechteinhaber würden durch eine analoge Anwendung der Schrankenbestimmung, die keine Vergütung für die Verwertung vorsieht, somit schutzlos gestellt. Das Risiko der Memorisierung stamme allein aus der Sphäre der Beklagten. Bei einer Analogie der Schranke würde ausschließlich der verletzte Rechteinhaber dieses Risiko tragen.
Unwesentliches Beiwerk? Kein Hauptwerk!
Mangels Vorliegens eines Hauptwerks stellten die Vervielfältigungen der streitgegenständlichen Liedtexte kein unzulässiges Beiwerk nach § 57 UrhG dar. Entgegen der Ansicht der Beklagten seien die Liedtexte nicht neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar anzusehen. Hierfür wäre erforderlich, dass es sich bei dem gesamten Trainigsdatensatz ebenfalls um ein urheberrechtlich geschütztes Werk handele.
Keine Rechtfertigung
Der Eingriff der Beklagten in die Verwertungsrechte der Klägerin sei auch nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt, da das Training von Modellen nicht als eine übliche und erwartbare Nutzungsart zu werten sei, mit der der Rechteinhaber rechnen müsse.
Wiedergabe in den Outputs rechtswidrig
Auch durch Wiedergabe der Liedtexte in den Outputs des Chatbots hätten die Beklagten nach der Entscheidung der Kammer unberechtigt die streitgegenständlichen Liedtexte vervielfältigt und öffentlich zugänglich gemacht. In den Outputs wären die originellen Elemente der Liedtexte stets wiedererkennbar.
Betreiber und nicht Nutzer verantwortlich
Hierfür seien die Beklagten und nicht die Nutzer verantwortlich. Die Outputs seien durch einfach gehaltene Prompts generiert worden. Die Beklagten betrieben die Sprachmodelle, für die die Liedtexte als Trainingsdaten ausgewählt und mit denen sie trainiert worden sind. Sie seien für die Architektur der Modelle und die Memorisierung der Trainingsdaten verantwortlich. Damit hätten die von den Beklagten betriebenen Sprachmodelle die ausgegebenen Outputs maßgeblich beeinflusst, der konkrete Inhalt der Outputs werde von den Sprachmodellen generiert.
Der Eingriff in die Verwertungsrechte durch die Outputs sei ebenfalls nicht durch eine Schrankenbestimmung gedeckt.
Das Urteil ist im Zeitpunkt der Veröffentlich nicht rechtskräftig.
(tg) - Quelle: PM Nr. 11 des LG München I vom 11.11.2025
Bearbeiter: Rechtsanwalt Thomas Ch. Gramespacher
Online seit: 11.11.2025
Kurz-Link zum Artikel: http://miur.de/3516
// Artikel gesammelt "frei Haus"? Hier den MIR-Newsletter abonnieren
Online seit: 11.11.2025
Kurz-Link zum Artikel: http://miur.de/3516
// Artikel gesammelt "frei Haus"? Hier den MIR-Newsletter abonnieren
Was Sie noch interessieren könnte...
Deutsche Wohnen - Eine Geldbuße nach Art. 83 DSGVO darf nur dann verhängt werden, wenn nachgewiesen ist, dass der Verantwortliche einen Verstoß vorsätzlich oder fahrlässig begangen hat
EuGH, Urteil vom 05.12.2023 - C-807/21, MIR 2023, Dok. 080
UKlaG-Streitwert - Bei einer auf § 1 oder § 4a UKlaG gestützten Klage eines Wirtschaftsverbands sind Gebührenstreitwert und Beschwer regelmäßig mit EUR 2.500,00 je angegriffener Teilklausel zu bemessen
BGH, Beschluss vom 17.11.2020 - X ZR 3/19, MIR 2021, Dok. 003
Riptide II - Die besonderen Umstände des Einzelfalls nach § 97a Abs. 3 Satz 4 UrhG müssen die bereits nach § 97a Abs. 3 Satz 2 UrhG tatbestandlich zu berücksichtigenden Merkmale überwiegen, um von einer Begrenzung des Gegenstandswerts absehen zu können
BGH, Urteil vom 01.09.2022 - I ZR 108/20, MIR 2022, Dok. 095
Kumulative Informationspflichten zur Verbraucherstreitbeilegung - Die Informationen nach § 36 Abs. 1 VSBG sind auf der Website und bei deren Verwendung auch in den AGB zu erteilen
BGH, Urteil vom 22.09.2020 - XI ZR 162/19, MIR 2020, Dok. 080
Fragen zum Umfang des urheberrechtlichen Zitatrechts der Presse an den EuGH
Bundesgerichtshof, MIR 2017, Dok. 031
EuGH, Urteil vom 05.12.2023 - C-807/21, MIR 2023, Dok. 080
UKlaG-Streitwert - Bei einer auf § 1 oder § 4a UKlaG gestützten Klage eines Wirtschaftsverbands sind Gebührenstreitwert und Beschwer regelmäßig mit EUR 2.500,00 je angegriffener Teilklausel zu bemessen
BGH, Beschluss vom 17.11.2020 - X ZR 3/19, MIR 2021, Dok. 003
Riptide II - Die besonderen Umstände des Einzelfalls nach § 97a Abs. 3 Satz 4 UrhG müssen die bereits nach § 97a Abs. 3 Satz 2 UrhG tatbestandlich zu berücksichtigenden Merkmale überwiegen, um von einer Begrenzung des Gegenstandswerts absehen zu können
BGH, Urteil vom 01.09.2022 - I ZR 108/20, MIR 2022, Dok. 095
Kumulative Informationspflichten zur Verbraucherstreitbeilegung - Die Informationen nach § 36 Abs. 1 VSBG sind auf der Website und bei deren Verwendung auch in den AGB zu erteilen
BGH, Urteil vom 22.09.2020 - XI ZR 162/19, MIR 2020, Dok. 080
Fragen zum Umfang des urheberrechtlichen Zitatrechts der Presse an den EuGH
Bundesgerichtshof, MIR 2017, Dok. 031



