Rechtspraak

Tekst- en datamining vs auteursrecht: eerste rechtspraak

Redactie

13 februari 2025

Tekst- en datamining is het machinaal scannen van data om informatie te verkrijgen, bijvoorbeeld ter ontwikkeling van een generatief AI-model. Met de invoering van de DSM-richtlijn in 2019 is deze bezigheid nader gekwalificeerd ten opzichte van het auteursrecht. In beginsel is tekst- en datamining van beschermde werken toegestaan, mits makers geen uitdrukkelijk voorbehoud maken (opt-out) en de toegang tot die werken rechtmatig is verkregen (art. 4 DSM-richtlijn). Voor zover tekst- en datamining geschiedt voor onderzoeksdoeleinden, geldt dat makers überhaupt geen voorbehoud kunnen maken (art. 3 DSM-richtlijn).

Ondanks de duidelijke wetgeving is het nog altijd zoeken in de praktijk, met name sinds de generatieve AI-boom van 2023. Zo is er bijvoorbeeld verwarring over de toepassing van de opt-out: volstaat een publieke mededeling, en wanneer is een voorbehoud “machineleesbaar”? Hoe kan er worden gecontroleerd of generatieve AI-exploitanten zich daadwerkelijk aan de opt-out houden en hoe zit het met de werken die al vóór de wetgeving zijn gescand? Met de invoering van de AI-verordening heeft de EU-wetgever het een en ander aan vragen beantwoord en de positie van makers verder verstevigd. Exploitanten zijn nu wettelijk verplicht om op opt-outs te scannen en zich daaraan te houden. Bovendien moeten zij samenvattingen bijhouden van de datasets die zij aan hun kunstmatige algoritmes hebben gevoed. Of makers baat zullen hebben bij deze aanvullende regels, zal nog moeten blijken, onder meer uit de rechtspraktijk. In dit kader is het interessant dat een Duitse rechter zich recentelijk, als eerste binnen de EU, heeft uitgesproken over de nieuwe wetgeving met betrekking tot generatieve AI. Hierover zal nu een beknopte analyse volgen.

De LAION-zaak

De Duitse uitspraak betreft een dataset van non-profitorganisatie LAION. Deze dataset van bijna 6 miljard beelden wordt door verschillende generatieve AI-exploitanten gebruikt om hun modellen te trainen. Fotograaf Robert Kneschke vindt het onterecht dat zijn foto in de dataset is opgenomen, aangezien hij daarvoor nooit zijn toestemming heeft gegeven. Aan de hand van een aantal interessante overwegingen concludeert de Duitse rechter dat de opname van de foto in de dataset niet onrechtmatig is.

Allereerst stelt de Duitse rechter dat er geen sprake is van een tijdelijke reproductiehandeling, omdat de reproductie niet van voorbijgaande of incidentele aard is (r.o. 58). Het opnemen van de foto in de dataset valt daarentegen onder de wettelijke definitie van tekst- en datamining, aangezien LAION de reproductie in dit geval heeft verricht met het oog op het verkrijgen van informatie over “correlaties” (r.o. 73). Dit betekent dat de beperkingsbepalingen voor tekst- en datamining van toepassing zijn. In het bijzonder de onvoorwaardelijke variant voor onderzoeksorganisaties, nu LAION geen winstoogmerk heeft en het doel nastreeft om wetenschappelijk onderzoek te bevorderen. Het enkele feit dat derde partijen de database van LAION kunnen gebruiken voor de commerciële exploitatie van generatieve AI, maakt dat niet anders (r.o. 87, 114). LAION handelt dan ook niet in strijd met de wet.

Hoewel de opt-out regeling in dit geval niet van toepassing is, gaat de Duitse rechter daar wel nader op in. Fotograaf Kneschke heeft zijn opt-out in dit geval op zijn website vermeld in “natuurlijke taal”. De rechter acht het verdedigbaar dat een dergelijke opt-out als machineleesbaar kan worden aangemerkt, gelet op het feit dat hedendaagse technologieën in staat zijn om onze communicatie te interpreteren (r.o. 102). Wel moet daarbij rekening worden gehouden met de context van de zaak. In dit geval vond de reproductie plaats in 2021, toen de technologie nog minder ver gevorderd was dan nu.

Hoe nu verder

De kop is eraf: deze uitspraak is ongetwijfeld een van vele andere die nog zullen volgen. Opvallend is dat de Duitse rechter veel waarde hecht aan het maatschappelijk belang bij wetenschappelijk onderzoek en, in dat kader, de beschikbaarheid van grote datasets. Het belang van makers moet hiervoor wijken, ondanks het feit dat ook generatieve AI-exploitanten deze datasets kunnen benutten. Een vraag die gesteld kan worden is of de opt-out regeling op deze manier niet geheel omzeild kan worden in de praktijk. In plaats van direct bij de websites van makers aan te kloppen, zullen generatieve AI-exploitanten geneigd zijn om de datasets van onderzoeksorganisaties als LAION te scannen. Aangezien makers niet direct betrokken zijn bij dergelijke datasets, zullen zij dit proces niet of nauwelijks kunnen voorkomen middels de opt-out. Daarmee worden makers aangetast in hun exclusieve auteursrecht. Het is afwachten of het Europese Hof meegaat in de conclusie van de Duitse rechter, en zo ja, hoe deze problematiek wordt aangepakt.

De recent aangenomen AI-verordening zou overigens soelaas kunnen bieden, gelet op het feit dat generatieve AI-exploitanten nu verplicht worden om samenvattingen bij te houden van alle door hen gebruikte datasets (artikel 53 lid 1 sub d AI-verordening). Op basis van de samenvattingen zouden vergoedingen kunnen worden berekend die aan de desbetreffende makers kunnen worden betaald in ruil voor het tekst- en dataminingproces. Wel is hiervoor de invoering vereist van een aanvullende vergoedingsregeling, waarover meer in onze uitgebreide artikelenreeks).

AI-forum 2025/1

Google aangeklaagd om AI-summaries in zoekresultaten

Meer en meer bedrijven integreren AI in hun diensten, en techgigant Google is daar uiteraard geen uitzondering van. Van oorsprong indexeert de zoekmachine webpagina's die als aanklikbare links aan gebruikers worden getoond nadat zij daarvoor relev...

AI-Forum 2025-1

Bijgaand treft u de eerste editie aan van ons digitale tijdschrift. Onderwerpen die aan bod komen zijn onder andere aansprakelijkheid, privacy, AI-geletterdheid, AI in reclame, tekst- en datamining en de compensatie van makers voor het gebruik van...

Tekst- en datamining vs auteursrecht: eerste rechtspraak

Zijn minderjarigen voldoende beschermd tegen AI?

Men komt op steeds jongere leeftijd in aanraking met steeds meer technologische hulpmiddelen. Die middelen worden ook steeds geavanceerder en, op veel manieren, ingrijpender. De millennial kan zich nauwelijks voorstellen hoe generatie Z en Alpha v...

Cybersecurity in een nieuw jasje

De Algemene Inlichtingen- en Veiligheidsdienst (AIVD) en de Rijksinspectie Digitale Infrastructuur (RDI) hebben een nieuw plan van aanpak uitgebracht met betrekking tot generatieve AI. Het daarin uitgewerkte AI Cybersecurity Kwadrant is er volgens...

Automatisering van de arbeidsmarkt

AI gaat steeds meer banen vervangen. Althans, als het aan de topbestuurders van grote Nederlandse bedrijven ligt. Een aanzienlijke groep van hen (19% ten opzichte van 6% vorig jaar) verwacht dat AI op den duur het werk van mensen zal gaan overneme...

Amerikaanse rechter verwerpt fair use als grond voor tekst- en datamining

In een filmachtige wending heeft Amerikaanse rechter Bibas zijn zogenoemde summary judgement (een soort kort geding) in de zaak Thomson Reuters v Ross omgegooid: in plaats van een jury bij het geschil te betrekken wordt het geschil grotendeels afg...

Censuur in AI: niet alleen een Chinees fenomeen

Als het om Chinese AI gaat hoor je al snel de klacht: censuur! Maar alle huidige AI-modellen hebben onderwerpen waar ze liever niet op ingaan, ook de Westerse. Een echte open AI waarin die keuze vooraf duidelijk en inzichtelijk is zou een stuk bet...

Machine “Unlearning”: nieuwe hoop voor mens en maker?

Er is veel over te doen geweest, met name in de creatieve industrie: het proces van machine learning en tekst- en datamining. Voordat kunstmatige algoritmes op het niveau presteren dat we van ze gewend zijn, ondergaan ze een langdurig trainingspro...

Mijn en dijn: de nieuwe rol van robots.txt als auteursrechtelijk voorbehoud bij tekst- en datamining

Noot bij Rb. Amsterdam HowardsHome[1]

Langzaamaan beginnen vonnissen gewezen te worden die grotere of kleinere impact hebben op de AI-wereld. Eén van de onderwerpen waar veel over te doen is, is de (on)rechtmatigheid van het gebruik van auteursre...