Terug naar overzicht

Rechtspraak

Derde rechtszaak tegen Anthropic: kun je tekst- en datamining contractueel verbieden?

Reddit heeft een rechtszaak aangespannen tegen AI-ontwikkelaar Anthropic. De aanklacht draait om het vermeende herhaaldelijk scrapen van Reddit-data door Anthropic, ondanks eerdere toezeggingen om daarmee te stoppen. Daarmee voegt deze zaak zich in de groeiende reeks geschillen over het gebruik van online content voor AI-training. In deze blog bespreken we eerst de feiten van de zaak en vervolgens de juridische implicaties ervan, met aandacht voor het unieke aspect dat deze procedure onderscheidt van andere.

 

“This case is about the two faces of Anthropic”
Afgelopen week heeft Reddit een aanklacht ingediend bij de rechtbank van San Francisco. Reddit stelt dat Anthropic sinds juli 2024 meer dan 100.000 keer toegang heeft gehad tot Reddit, terwijl het bedrijf eerder had aangegeven te stoppen met het verzamelen van data van het platform. Reddit positioneert Anthropic in de aanklacht als een laatkomer in de AI-sector die zich publiekelijk misschien wel ethisch voordoet, maar die achter de schermen regels negeert om winst te maximaliseren. Anthropic, bekend van haar AI-chatbot Claude, ontkent de beschuldigingen en geeft aan zich krachtig te zullen verdedigen.

 

Volgens Reddit vertegenwoordigt de door gebruikers gegenereerde content op het platform een enorme commerciële waarde, juist omdat het authentieke menselijke gesprekken betreft die cruciaal zijn voor het trainen van taalmodellen. Reddit sloot eerder al een lucratieve deal met Google voor het leveren van AI-trainingsdata, ter waarde van zo’n 60 miljoen dollar per jaar.

 

Deze zaak is de derde juridische procedure die tegen Anthropic is aangespannen in het kader van AI-training. Eerder werd Anthropic aangeklaagd door een groep auteurs wegens het zonder toestemming gebruiken van hun boeken voor trainingsdoeleinden. Daarnaast spanden diverse muziekuitgevers onder leiding van Universal Music een zaak aan wegens het ongeoorloofd gebruiken en verspreiden van songteksten in de output van Claude. In beide zaken lopen de procedures nog en is voorlopig geen definitieve uitspraak gedaan.

 

Juridische analyse
De kern van de nieuwe claim ligt in het verwijt dat Anthropic ondanks eerdere beloften, en in strijd met de gebruiksvoorwaarden van Reddit, alsnog op grote schaal data heeft gecrawld. Op zichzelf is web scraping, beter bekend als tekst- en datamining, naar Amerikaans recht niet onrechtmatig.

 

Auteursrechtelijke dimensie
Dat kan anders zijn als er auteursrechtelijk beschermde werken worden gescraped, wat hier naar alle waarschijnlijkheid het geval is, gezien de omvang van het platform en de hoeveelheid content. Of tekst- en datamining van beschermde werken wel of niet is toegestaan moet worden beoordeeld aan de hand van de fair-use doctrine.

 

Fair use is een open norm waarbij vier factoren meewegen, waaronder het doel en karakter van het gebruik (in dit geval het scrapen), de aard van het oorspronkelijke werk, de hoeveelheid overgenomen materiaal en het effect op de marktwaarde van het oorspronkelijke werk. Volgens de US Copyright Office is tekst- en datamining voor de ontwikkeling van AI lang niet altijd fair use. Doorslaggevend zijn de omstandigheden van het geval, waaronder de vraag of het AI-model een nieuw, transformatief doel dient dat wezenlijk verschilt van het oorspronkelijke gebruiksdoel van het trainingsmateriaal. De (hoogste) rechter heeft hierover nog geen definitieve uitspraak gedaan. Daarmee past deze zaak in het bredere juridische spanningsveld waar inmiddels ruim veertig Amerikaanse zaken over lopen.

 

Verbintenisrechtelijke dimensie
Maar wat deze zaak vooral uniek maakt is de verbintenisrechtelijke invalshoek. Volgens Reddit is in de User Agreement en Privacy Policy uitdrukkelijk bepaald dat commerciële scraping verboden is. Nu Anthropic met haar bots toegang heeft gehad tot het platform en alsnog data heeft gescraped, zou zij deze gebruiksvoorwaarden hebben geschonden. Dat levert wanprestatie op, met aansprakelijkheid voor schadevergoeding tot gevolg, waar Reddit zich nu op beroept. Reddit vordert daarnaast ook schadevergoeding wegens onrechtmatige verrijking en winstderving. Verder beroept het zich op aantasting van de technische infrastructuur, misleiding en oneerlijke concurrentie. 

 

Opvallend is dat Reddit minder de nadruk legt op auteursrechtelijke inbreuk, zoals in veel andere AI-zaken, en juist inzet op contractschending en bredere civielrechtelijke claims. Daarmee kan deze zaak mogelijk belangrijke precedenten opleveren voor de vraag hoe partijen zich privaatrechtelijk kunnen weren tegen AI-training.

 

Afsluitend
Deze zaak tegen Anthropic draagt net als de andere twee bij aan het bredere debat over AI-training en het gebruik van online content. Dit keer gaat het niet alleen om de discussie over fair use, maar ook om de mogelijke inzet van contractuele en privaatrechtelijke claims. Het is nu aan de Amerikaanse rechter om zich over de kwestie te buigen.

AI-forum 2025/2
Terug naar overzicht

Rechtspraak

Derde rechtszaak tegen Anthropic: kun je tekst- en datamining contractueel verbieden?

Reddit heeft een rechtszaak aangespannen tegen AI-ontwikkelaar Anthropic. De aanklacht draait om het vermeende herhaaldelijk scrapen van Reddit-data door Anthropic, ondanks eerdere toezeggingen om daarmee te stoppen. Daarmee voegt deze zaak zich in de groeiende reeks geschillen over het gebruik van online content voor AI-training. In deze blog bespreken we eerst de feiten van de zaak en vervolgens de juridische implicaties ervan, met aandacht voor het unieke aspect dat deze procedure onderscheidt van andere.

 

“This case is about the two faces of Anthropic”
Afgelopen week heeft Reddit een aanklacht ingediend bij de rechtbank van San Francisco. Reddit stelt dat Anthropic sinds juli 2024 meer dan 100.000 keer toegang heeft gehad tot Reddit, terwijl het bedrijf eerder had aangegeven te stoppen met het verzamelen van data van het platform. Reddit positioneert Anthropic in de aanklacht als een laatkomer in de AI-sector die zich publiekelijk misschien wel ethisch voordoet, maar die achter de schermen regels negeert om winst te maximaliseren. Anthropic, bekend van haar AI-chatbot Claude, ontkent de beschuldigingen en geeft aan zich krachtig te zullen verdedigen.

 

Volgens Reddit vertegenwoordigt de door gebruikers gegenereerde content op het platform een enorme commerciële waarde, juist omdat het authentieke menselijke gesprekken betreft die cruciaal zijn voor het trainen van taalmodellen. Reddit sloot eerder al een lucratieve deal met Google voor het leveren van AI-trainingsdata, ter waarde van zo’n 60 miljoen dollar per jaar.

 

Deze zaak is de derde juridische procedure die tegen Anthropic is aangespannen in het kader van AI-training. Eerder werd Anthropic aangeklaagd door een groep auteurs wegens het zonder toestemming gebruiken van hun boeken voor trainingsdoeleinden. Daarnaast spanden diverse muziekuitgevers onder leiding van Universal Music een zaak aan wegens het ongeoorloofd gebruiken en verspreiden van songteksten in de output van Claude. In beide zaken lopen de procedures nog en is voorlopig geen definitieve uitspraak gedaan.

 

Juridische analyse
De kern van de nieuwe claim ligt in het verwijt dat Anthropic ondanks eerdere beloften, en in strijd met de gebruiksvoorwaarden van Reddit, alsnog op grote schaal data heeft gecrawld. Op zichzelf is web scraping, beter bekend als tekst- en datamining, naar Amerikaans recht niet onrechtmatig.

 

Auteursrechtelijke dimensie
Dat kan anders zijn als er auteursrechtelijk beschermde werken worden gescraped, wat hier naar alle waarschijnlijkheid het geval is, gezien de omvang van het platform en de hoeveelheid content. Of tekst- en datamining van beschermde werken wel of niet is toegestaan moet worden beoordeeld aan de hand van de fair-use doctrine.

 

Fair use is een open norm waarbij vier factoren meewegen, waaronder het doel en karakter van het gebruik (in dit geval het scrapen), de aard van het oorspronkelijke werk, de hoeveelheid overgenomen materiaal en het effect op de marktwaarde van het oorspronkelijke werk. Volgens de US Copyright Office is tekst- en datamining voor de ontwikkeling van AI lang niet altijd fair use. Doorslaggevend zijn de omstandigheden van het geval, waaronder de vraag of het AI-model een nieuw, transformatief doel dient dat wezenlijk verschilt van het oorspronkelijke gebruiksdoel van het trainingsmateriaal. De (hoogste) rechter heeft hierover nog geen definitieve uitspraak gedaan. Daarmee past deze zaak in het bredere juridische spanningsveld waar inmiddels ruim veertig Amerikaanse zaken over lopen.

 

Verbintenisrechtelijke dimensie
Maar wat deze zaak vooral uniek maakt is de verbintenisrechtelijke invalshoek. Volgens Reddit is in de User Agreement en Privacy Policy uitdrukkelijk bepaald dat commerciële scraping verboden is. Nu Anthropic met haar bots toegang heeft gehad tot het platform en alsnog data heeft gescraped, zou zij deze gebruiksvoorwaarden hebben geschonden. Dat levert wanprestatie op, met aansprakelijkheid voor schadevergoeding tot gevolg, waar Reddit zich nu op beroept. Reddit vordert daarnaast ook schadevergoeding wegens onrechtmatige verrijking en winstderving. Verder beroept het zich op aantasting van de technische infrastructuur, misleiding en oneerlijke concurrentie. 

 

Opvallend is dat Reddit minder de nadruk legt op auteursrechtelijke inbreuk, zoals in veel andere AI-zaken, en juist inzet op contractschending en bredere civielrechtelijke claims. Daarmee kan deze zaak mogelijk belangrijke precedenten opleveren voor de vraag hoe partijen zich privaatrechtelijk kunnen weren tegen AI-training.

 

Afsluitend
Deze zaak tegen Anthropic draagt net als de andere twee bij aan het bredere debat over AI-training en het gebruik van online content. Dit keer gaat het niet alleen om de discussie over fair use, maar ook om de mogelijke inzet van contractuele en privaatrechtelijke claims. Het is nu aan de Amerikaanse rechter om zich over de kwestie te buigen.

AI-forum 2025/2