this post was submitted on 14 Jan 2025
10 points (91.7% liked)
Netzkultur / Netzpolitik
573 readers
116 users here now
Alles rund um das Internet. Gerne auch die politische Seite zum Thema
Als Nachfolger für [email protected]
Wir sehen uns als einen selbstbestimmten Raum, außerhalb der Kontrolle kommerzieller Tech-Unternehmen.
Netiquette wird vorausgesetzt. Gepflegt wird ein respektvoller Umgang - ohne Hass, Hetze, Diskriminierung.
Die Regeln von feddit.org gelten.
Das Bild im Banner und Icon: Public Domain generated with Midjourney gefunden auf netzpolitik.org
founded 7 months ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
Aber das Problem besteht doch im Nachweis der Nutzung von urheberrechtlich geschütztem Trainingsmaterial. Wie soll das funktionieren, ohne dass ein ewiger Rechtsstreit ohne Ergebnis entbrennt?
Die Rechtslage ist so: Für den AI Act muss bald offengelegt werden, auf was für "geschützten" Inhalten trainiert wurde. Das wird wohl die meisten Open Source Modelle illegal machen. Firmen müssen dann mit Geldstrafen rechnen. Nur rein private Nutzung bleibt ungefährlich.
Das europäische Urheberrecht sieht vor, dass ein Nutzungsvorbehalt für KI-Training möglich ist. Deswegen kann zB Reddit Geld verlangen, wenn auf Posts trainiert wird.
Irgendwie kriegt man das schon hin. Man schafft es ja auch, dass Betriebe nicht alle Windows-Lizenzen klauen, gegen alle Auflagen verstoßen und alles Bargeld am Finanzamt vorbei schleusen. Also das ist sicher nicht leicht. Und grad die großen amerikanischen Firmen sind wahrscheinlich schlecht zu packen. Aber im Zweifelsfall denke ich greifen da dies selben Mechanismen wie bei anderen Dingen auch.
Wenn die Unternehmen nicht beweisen koennen, dass ihre Werke frei von urheberrechtlichem Traingsmaterial sind, dann darf das Produkt nicht verwendet werden, oder der gesamte Gewinn den die KI erwirtschaftet wird als "gestohlen" deklariert und damit eingezogen.
Die Beweislast MUSS beim Unternehmen liegen, sonst wird das nichts. Die verdienen keine Unschuldsvermutung...
Das ist einerseits nicht wirklich im Sinne unseres Rechtsstaates, aber vor allen Dingen wäre meine Frage: welche Unternehmen sollen denn dann in dieser Beweislast liegen? Die, die das Modell trainiert haben? Oder die, die es nutzen? Was ist mit freien Modellen wie z.B. Stable Diffusion?
Ich finde es nicht im Sinne des Rechtsstaates das Unternehmen einfach stehlen duerfen und nicht dafuer belangt werden. Genauso wie dass Kuenstler kaum Moeglichkeiten haben dagegen vorzugehen.
Die Beweislast muss notwendigerweise bei den Unternehmen liegen die das Modell trainieren, weil dort kommen die gestohlenen Sachen in die Maschine. Spaeter laesst sich das ja nicht mehr aendern.
Freie Modelle sind fein, solange sie nicht fuer komerzielle Zwecke genutzt werden.
Es geht am Ende darum dass Verbindlichkeit hergestellt wird, weil aktuell koennen Firmen einfach alles einsammeln und benutzen wie sie wollen. In keinem anderen Industriezweig der mir einfaellt waere so ein vorgehen legal oder uebliche Praxis.
Warum ist es okay, für freie Modelle urheberrechtlich geschütztes Material zu verwenden? Kann es sein, dass du einfach einen Hass auf Unternehmen hast? Ich würde hier deutlich mehr differenzieren wollen. Vorschlag hier: wer ein Modell trainiert oder Finetuning betreibt, muss die Quellen attributieren. Wenn ein Unternehmen dieses Modell nutzt, sehe ich nicht, warum es automatisch in der Bringschuld bzw im Verdacht der Urheberrechtsverletzung stehen sollte, da es ja auf der Prämisse der urheberrechtlichen Korrektheit das Modell eingekauft hat.
Die Grundfrage bleibt aber bestehen: wie kann einwandfrei nachgewiesen werden, dass widerrechtlich urheberrechtliches Material für das Training genutzt wurde?