Rechtspraak
Derde rechtszaak tegen Anthropic: kun je tekst- en datamining contractueel verbieden?
Redactie
Reddit heeft een rechtszaak aangespannen tegen AI-ontwikkelaar Anthropic. De aanklacht draait om het vermeende herhaaldelijk scrapen van Reddit-data door Anthropic, ondanks eerdere toezeggingen om daarmee te stoppen. Daarmee voegt deze zaak zich in de groeiende reeks geschillen over het gebruik van online content voor AI-training. In deze blog bespreken we eerst de feiten van de zaak en vervolgens de juridische implicaties ervan, met aandacht voor het unieke aspect dat deze procedure onderscheidt van andere.
“This case is about the two faces of Anthropic”
Afgelopen week heeft Reddit een aanklacht ingediend bij de rechtbank van San Francisco. Reddit stelt dat Anthropic sinds juli 2024 meer dan 100.000 keer toegang heeft gehad tot Reddit, terwijl het bedrijf eerder had aangegeven te stoppen met het verzamelen van data van het platform. Reddit positioneert Anthropic in de aanklacht als een laatkomer in de AI-sector die zich publiekelijk misschien wel ethisch voordoet, maar die achter de schermen regels negeert om winst te maximaliseren. Anthropic, bekend van haar AI-chatbot Claude, ontkent de beschuldigingen en geeft aan zich krachtig te zullen verdedigen.
Volgens Reddit vertegenwoordigt de door gebruikers gegenereerde content op het platform een enorme commerciële waarde, juist omdat het authentieke menselijke gesprekken betreft die cruciaal zijn voor het trainen van taalmodellen. Reddit sloot eerder al een lucratieve deal met Google voor het leveren van AI-trainingsdata, ter waarde van zo’n 60 miljoen dollar per jaar.
Deze zaak is de derde juridische procedure die tegen Anthropic is aangespannen in het kader van AI-training. Eerder werd Anthropic aangeklaagd door een groep auteurs wegens het zonder toestemming gebruiken van hun boeken voor trainingsdoeleinden. Daarnaast spanden diverse muziekuitgevers onder leiding van Universal Music een zaak aan wegens het ongeoorloofd gebruiken en verspreiden van songteksten in de output van Claude. In beide zaken lopen de procedures nog en is voorlopig geen definitieve uitspraak gedaan.
Juridische analyse
De kern van de nieuwe claim ligt in het verwijt dat Anthropic ondanks eerdere beloften, en in strijd met de gebruiksvoorwaarden van Reddit, alsnog op grote schaal data heeft gecrawld. Op zichzelf is web scraping, beter bekend als tekst- en datamining, naar Amerikaans recht niet onrechtmatig.
Auteursrechtelijke dimensie
Dat kan anders zijn als er auteursrechtelijk beschermde werken worden gescraped, wat hier naar alle waarschijnlijkheid het geval is, gezien de omvang van het platform en de hoeveelheid content. Of tekst- en datamining van beschermde werken wel of niet is toegestaan moet worden beoordeeld aan de hand van de fair-use doctrine.
Fair use is een open norm waarbij vier factoren meewegen, waaronder het doel en karakter van het gebruik (in dit geval het scrapen), de aard van het oorspronkelijke werk, de hoeveelheid overgenomen materiaal en het effect op de marktwaarde van het oorspronkelijke werk. Volgens de US Copyright Office is tekst- en datamining voor de ontwikkeling van AI lang niet altijd fair use. Doorslaggevend zijn de omstandigheden van het geval, waaronder de vraag of het AI-model een nieuw, transformatief doel dient dat wezenlijk verschilt van het oorspronkelijke gebruiksdoel van het trainingsmateriaal. De (hoogste) rechter heeft hierover nog geen definitieve uitspraak gedaan. Daarmee past deze zaak in het bredere juridische spanningsveld waar inmiddels ruim veertig Amerikaanse zaken over lopen.
Verbintenisrechtelijke dimensie
Maar wat deze zaak vooral uniek maakt is de verbintenisrechtelijke invalshoek. Volgens Reddit is in de User Agreement en Privacy Policy uitdrukkelijk bepaald dat commerciële scraping verboden is. Nu Anthropic met haar bots toegang heeft gehad tot het platform en alsnog data heeft gescraped, zou zij deze gebruiksvoorwaarden hebben geschonden. Dat levert wanprestatie op, met aansprakelijkheid voor schadevergoeding tot gevolg, waar Reddit zich nu op beroept. Reddit vordert daarnaast ook schadevergoeding wegens onrechtmatige verrijking en winstderving. Verder beroept het zich op aantasting van de technische infrastructuur, misleiding en oneerlijke concurrentie.
Opvallend is dat Reddit minder de nadruk legt op auteursrechtelijke inbreuk, zoals in veel andere AI-zaken, en juist inzet op contractschending en bredere civielrechtelijke claims. Daarmee kan deze zaak mogelijk belangrijke precedenten opleveren voor de vraag hoe partijen zich privaatrechtelijk kunnen weren tegen AI-training.
Afsluitend
Deze zaak tegen Anthropic draagt net als de andere twee bij aan het bredere debat over AI-training en het gebruik van online content. Dit keer gaat het niet alleen om de discussie over fair use, maar ook om de mogelijke inzet van contractuele en privaatrechtelijke claims. Het is nu aan de Amerikaanse rechter om zich over de kwestie te buigen.
AI-forum 2025/2
Europese AI-verordening: nieuwe verplichtingen treden in, maar is het genoeg?
De Europese AI-verordening is sinds 1 augustus 2024 formeel van kracht, en komende maand volgt een belangrijke nieuwe fase. Vanaf augustus worden de eerste verplichtingen voor aanbieders van AI-systemen voor algemene doeleinden (general-purpose...
Disney en Universal trekken ten strijde tegen AI-bedrijf Midjourney
Disney en Universal hebben een rechtszaak aangespannen tegen het AI-bedrijf Midjourney. Volgens de twee Hollywood-giganten heeft Midjourney op grote schaal auteursrechtelijk beschermd beeldmateriaal gebruikt bij het trainen van zijn AI-modellen, z...
Hoe GPT-NL en Nextcloud de afhankelijkheid van Big Tech helpen terugdringen
In een wereld waarin taalmodellen als ChatGPT razendsnel terrein winnen, groeit ook het besef van afhankelijkheid. De meeste krachtige AI-systemen worden gebouwd en beheerd door een handvol grote Amerikaanse technologiebedrijven, die beperkte tran...
Google’s open-source medische AI biedt kansen, maar roept ook vragen op
Google heeft de lat opnieuw hoger gelegd. Met de lancering van de MedGemma-modellen betreedt de techgigant het domein van open-source medische AI op een schaal die eerder nog niet voorkwam. Waar vorige toepassingen vooral werden aangeboden als com...
Nepjurisprudentie: hoe AI de rechtspraak kan beïnvloeden zonder dat iemand het doorheeft
Een Amerikaanse advocaat citeerde vier niet-bestaande uitspraken in een verzoekschrift. Ze bleken afkomstig uit ChatGPT. De rechter ontdekte het, legde een boete op en verplichtte de betrokken advocaat tot het volgen van training voor het (ethisch...
Creatieve sector verontwaardigd over nieuwe Gedragscode AI-verordening
Het Europese AI-bureau heeft recent de derde en laatste conceptversie gepubliceerd van de Gedragscode voor aanbieders van generatieve AI, als aanvulling op de AI-verordening. Makers, uitvoerende kunstenaars en rechthebbenden reageren hierop veront...
GPT-4o en het Ghibli Effect: de genadeslag voor ontwerpers en rechthebbenden?
Afgelopen week stond social media vol met afbeeldingen in de kenmerkende stijl van de Japanse animatiestudio Ghibli. Dit was het gevolg van de release van OpenAI's nieuwe afbeeldingsgenerator, die onderdeel uitmaakt van de reeds bestaande chatbot ...
Google’s AI-summaries: innovatie of roofbouw? De laatste juridische ontwikkelingen
De introductie van AI-gegenereerde samenvattingen bovenaan zoekresultaten markeert een belangrijke verschuiving in hoe online informatie wordt geconsumeerd. Waar Google’s AI Overviews miljoenen gebruikers helpt om sneller antwoorden te vinden, roe...
De verboden metafoor: AI en antropomorf taalgebruik
Inleiding
Op het snijvlak van auteursrecht & AI is regelmatig (felle) kritiek te lezen op ‘antropomorfiserend’ taalgebruik. Wanneer we als juristen schrijven over AI is het volgens velen onwenselijk dat daarbij ‘mensachtige’ termen worden gebruik...
Rechtspraak
Derde rechtszaak tegen Anthropic: kun je tekst- en datamining contractueel verbieden?
Redactie
Reddit heeft een rechtszaak aangespannen tegen AI-ontwikkelaar Anthropic. De aanklacht draait om het vermeende herhaaldelijk scrapen van Reddit-data door Anthropic, ondanks eerdere toezeggingen om daarmee te stoppen. Daarmee voegt deze zaak zich in de groeiende reeks geschillen over het gebruik van online content voor AI-training. In deze blog bespreken we eerst de feiten van de zaak en vervolgens de juridische implicaties ervan, met aandacht voor het unieke aspect dat deze procedure onderscheidt van andere.
“This case is about the two faces of Anthropic”
Afgelopen week heeft Reddit een aanklacht ingediend bij de rechtbank van San Francisco. Reddit stelt dat Anthropic sinds juli 2024 meer dan 100.000 keer toegang heeft gehad tot Reddit, terwijl het bedrijf eerder had aangegeven te stoppen met het verzamelen van data van het platform. Reddit positioneert Anthropic in de aanklacht als een laatkomer in de AI-sector die zich publiekelijk misschien wel ethisch voordoet, maar die achter de schermen regels negeert om winst te maximaliseren. Anthropic, bekend van haar AI-chatbot Claude, ontkent de beschuldigingen en geeft aan zich krachtig te zullen verdedigen.
Volgens Reddit vertegenwoordigt de door gebruikers gegenereerde content op het platform een enorme commerciële waarde, juist omdat het authentieke menselijke gesprekken betreft die cruciaal zijn voor het trainen van taalmodellen. Reddit sloot eerder al een lucratieve deal met Google voor het leveren van AI-trainingsdata, ter waarde van zo’n 60 miljoen dollar per jaar.
Deze zaak is de derde juridische procedure die tegen Anthropic is aangespannen in het kader van AI-training. Eerder werd Anthropic aangeklaagd door een groep auteurs wegens het zonder toestemming gebruiken van hun boeken voor trainingsdoeleinden. Daarnaast spanden diverse muziekuitgevers onder leiding van Universal Music een zaak aan wegens het ongeoorloofd gebruiken en verspreiden van songteksten in de output van Claude. In beide zaken lopen de procedures nog en is voorlopig geen definitieve uitspraak gedaan.
Juridische analyse
De kern van de nieuwe claim ligt in het verwijt dat Anthropic ondanks eerdere beloften, en in strijd met de gebruiksvoorwaarden van Reddit, alsnog op grote schaal data heeft gecrawld. Op zichzelf is web scraping, beter bekend als tekst- en datamining, naar Amerikaans recht niet onrechtmatig.
Auteursrechtelijke dimensie
Dat kan anders zijn als er auteursrechtelijk beschermde werken worden gescraped, wat hier naar alle waarschijnlijkheid het geval is, gezien de omvang van het platform en de hoeveelheid content. Of tekst- en datamining van beschermde werken wel of niet is toegestaan moet worden beoordeeld aan de hand van de fair-use doctrine.
Fair use is een open norm waarbij vier factoren meewegen, waaronder het doel en karakter van het gebruik (in dit geval het scrapen), de aard van het oorspronkelijke werk, de hoeveelheid overgenomen materiaal en het effect op de marktwaarde van het oorspronkelijke werk. Volgens de US Copyright Office is tekst- en datamining voor de ontwikkeling van AI lang niet altijd fair use. Doorslaggevend zijn de omstandigheden van het geval, waaronder de vraag of het AI-model een nieuw, transformatief doel dient dat wezenlijk verschilt van het oorspronkelijke gebruiksdoel van het trainingsmateriaal. De (hoogste) rechter heeft hierover nog geen definitieve uitspraak gedaan. Daarmee past deze zaak in het bredere juridische spanningsveld waar inmiddels ruim veertig Amerikaanse zaken over lopen.
Verbintenisrechtelijke dimensie
Maar wat deze zaak vooral uniek maakt is de verbintenisrechtelijke invalshoek. Volgens Reddit is in de User Agreement en Privacy Policy uitdrukkelijk bepaald dat commerciële scraping verboden is. Nu Anthropic met haar bots toegang heeft gehad tot het platform en alsnog data heeft gescraped, zou zij deze gebruiksvoorwaarden hebben geschonden. Dat levert wanprestatie op, met aansprakelijkheid voor schadevergoeding tot gevolg, waar Reddit zich nu op beroept. Reddit vordert daarnaast ook schadevergoeding wegens onrechtmatige verrijking en winstderving. Verder beroept het zich op aantasting van de technische infrastructuur, misleiding en oneerlijke concurrentie.
Opvallend is dat Reddit minder de nadruk legt op auteursrechtelijke inbreuk, zoals in veel andere AI-zaken, en juist inzet op contractschending en bredere civielrechtelijke claims. Daarmee kan deze zaak mogelijk belangrijke precedenten opleveren voor de vraag hoe partijen zich privaatrechtelijk kunnen weren tegen AI-training.
Afsluitend
Deze zaak tegen Anthropic draagt net als de andere twee bij aan het bredere debat over AI-training en het gebruik van online content. Dit keer gaat het niet alleen om de discussie over fair use, maar ook om de mogelijke inzet van contractuele en privaatrechtelijke claims. Het is nu aan de Amerikaanse rechter om zich over de kwestie te buigen.
AI-forum 2025/2
Overzicht: AI en auteursrecht in de VS (ontwikkelingen van 1–7 september 2025)
De afgelopen week stond in het teken van drie grote juridische ontwikkelingen op het snijvlak van AI en auteursrecht in de Verenigde Staten. Van Hollywood-studio’s die generatieve beeldmodellen aanklagen, tot een miljardenschikking van Anthropic: ...
Wanneer AI leeft: juridische en ethische vraagstukken rond biohybride AI
Inleiding
Kunstmatige intelligentie ontwikkelt zich snel, onder andere op het snijvlak van technologie en biologie. Biohybride AI-systemen, oftewel AI die draait op levende cellen, zetten niet alleen technologische conventies op hun kop, maar dag...
The Dutch and Danish proposals for legislation on deepfakes
This article contains a summary and a brief comparison of the Dutch and Danish proposals for legislation relating to deepfakes.
The Dutch proposal is an initiative of member of parliament ms. Rosemarijn Dral, based on an article published in O...
Europa's definitieve AI-gedragscode: veiligheid, auteursrecht en transparantie in aanloop naar 2 augustus 2025
Op 2 augustus 2025 gaan de verplichtingen uit de AI-verordening in voor aanbieders van AI-modellen voor algemene doeleinden. In aanloop naar het nieuwe wettelijke kader heeft het Europese AI Office onlangs de definitieve versie van de gedragscode ...
Denemarken zet stap richting nieuw verbodsrecht op deepfakes
De Deense regering heeft aangekondigd het auteursrecht te willen aansterken om zo de verspreiding van deepfakes effectiever te bestrijden. In tegenstelling tot eerdere initiatieven, waarbij met name pornografische deepfakes werden aangepakt, richt...
AI-training en auteursrecht: de internationale verschillen
Mag je auteursrechtelijk beschermd werk gebruiken om AI-modellen te trainen? Die vraag houdt wetgevers wereldwijd bezig. Als onderdeel van haar recente rapport, heeft het Amerikaanse Copyright Office in kaart gebracht hoe verschillende landen AI-t...
Meester of machine? Professionele autonomie in het tijdperk van AI
1. Introductie
Kunstmatige intelligentie (AI) beïnvloedt nagenoeg alle sectoren, waaronder kennisintensieve beroepen.[1] Dit geldt ook voor de juridische sector, en met name de advocatuur. AI verwijst in hoofdzaak naar het vermogen van machines o...
