Rechtspraak

Reddit v. Perplexity: waar ligt de grens tussen open internet en onrechtmatige content-scraping?

Redactie

30 oktober 2025

Reddit heeft een rechtszaak aangespannen tegen Perplexity AI en drie datascrapingbedrijven: SerpApi, Oxylabs en AWMProxy, wegens het op grote schaal kopiëren van Reddit-content voor commerciële AI-toepassingen. De stap volgt enkele maanden na een vergelijkbare procedure tegen AI-bedrijf Anthropic. De nieuwe aanklacht is gebaseerd op het Amerikaanse auteursrecht (Copyright Act) en wijkt af van andere AI-zaken doordat niet de trainingsfase, maar de dataverzameling zelf centraal staat. Reddit stelt dat het automatisch scrapen van beschermde content op zichzelf onrechtmatig is en beschuldigt de bedrijven van het omzeilen van technische beschermingsmaatregelen en het zonder toestemming gebruiken van auteursrechtelijk materiaal.

“Noord-Koreaanse” praktijken, aldus Reddit

Reddit beschuldigt de vier partijen (gedaagden) van het gezamenlijk verkrijgen van Reddit-data via ongeoorloofde scraping. Aangezien Reddit flink heeft geïnvesteerd in anti-scraping maatregelen, zoals IP-limieten, gebruikersidentificatie en CAPTCHA-systemen, zouden gedaagden hun aandacht hebben verlegd naar de zoekresultaten van Google (SERPs), waarin Reddit-berichten vaak zichtbaar zijn. Ook Google verbiedt automatische scraping, maar volgens Reddit hebben gedaagden de barrières van Google omzeild. De verzamelde gegevens zijn vervolgens gebruikt voor Perplexity’s answer engine AI.

Reddit stelt dat gedaagden, in het bijzonder SerpApi, Oxylabs en AWMProxy, in korte tijd miljarden zoekresultaten met Reddit-inhoud hebben opgevraagd. Deze informatie is volgens de aanklacht afkomstig van Google, dat op verzoek van Reddit technische gegevens heeft overgelegd over dataverkeer van de betrokken netwerken.

Daarnaast voerde Reddit een praktische test uit om te controleren of Perplexity daadwerkelijk toegang kreeg tot Reddit-data via Google. Op het platform werd een uniek bericht geplaatst dat nergens anders op internet bestond en uitsluitend via Google te vinden was. Kort daarna verscheen dezelfde tekst in Perplexity’s generatieve antwoorden. Volgens Reddit toont dit aan dat gedaagden Google’s zoekresultaten hebben gescrapet en dat Perplexity de verkregen data in zijn systeem gebruikte.

Hoewel Reddit gedaagden over één kam scheert, lijkt het bewijs voor daadwerkelijke samenwerking beperkt. De belangrijkste aanwijzing is dat op SerpApi’s website Perplexity wordt vermeld als “customer”. Daarnaast wijst Reddit erop dat de scrapingbedrijven zich openlijk profileren met het omzeilen van Google’s technische barrières.

Perplexity ontkent de aantijgingen. Het bedrijf stelt dat het uitsluitend openbare informatie samenvat en geen AI-modellen traint op Reddit-data. Volgens Perplexity probeert Reddit met deze rechtszaak de vrije toegang tot informatie op internet te beperken.

Kern van de zaak

Centraal staat de vraag of het automatisch verzamelen van publiek toegankelijke webdata een inbreuk op het auteursrecht kan opleveren wanneer dat gebeurt in strijd met technische en contractuele beperkingen. Reddit meent van wel en ziet zowel directe als indirecte auteursrechtelijke schendingen onder de DMCA. Dat betreft zowel Reddit’s eigen content als de bijdragen van gebruikers waarop Reddit licentierechten heeft. Door beperkingen te omzeilen, zouden de gedaagden de legitieme exploitatie van Reddit-data via betaalde licenties ondermijnen.

Juridische analyse

Naast de vermeende auteursrechtinbreuk beroept Reddit zich op meerdere civielrechtelijke grondslagen. Hieronder worden de verschillende claims beknopt toegelicht.

Auteursrechtelijke grondslag: DMCA-schending

De DMCA (17 U.S.C. § 1201) verbiedt het omzeilen van technologische maatregelen die toegang tot auteursrechtelijk beschermde werken beperken. Reddit stelt dat de gedaagden precies dat hebben gedaan:

SerpApi, Oxylabs en AWMProxy zouden beveiliging van zowel Reddit als Google hebben omzeild door proxy-netwerken en bots te gebruiken die menselijke gebruikers imiteren;
Perplexity zou de vruchten daarvan hebben geplukt door de gescrapete data te verwerken in haar commerciële AI-engine.

Reddit klaagt alle partijen aan voor “circumvention of technological measures” en voegt ten aanzien van SerpApi en Oxylabs twee aanvullende DMCA-bepalingen toe die het aanbieden van circumvention-technologie in het algemeen verbieden. SerpApi’s eigen marketing (“we bypass Google’s restrictions”) en producten als Ludicrous Speed Max worden aangehaald als bewijs dat het bedrijf tools aanbiedt die primair zijn ontworpen om beveiliging te doorbreken.

Deze benadering is opvallend: in andere AI-zaken ligt de focus veelal op fair use (of een werk mag worden gebruikt), terwijl Reddit hier stelt dat het al onrechtmatig is om een werk te betreden en/of te gebruiken als dat via omzeiling gebeurt.

Civielrechtelijke aanvulling

Naast de DMCA-claims bevat de aanklacht klassieke civielrechtelijke grondslagen:

Unfair competition (oneerlijke handelspraktijken): gedaagden zouden op oneerlijke wijze concurrentievoordeel behalen door technologische beveiliging te omzeilen en zo Reddit’s arbeid, investeringen en goodwill te misbruiken. Daarmee zouden zij niet alleen licentiekosten hebben vermeden, maar ook Reddit’s commerciële relaties met bedrijven als Google en OpenAI hebben ondermijnd en de waarde van het platform voor gebruikers en adverteerders hebben aangetast.
Unjust enrichment (ongerechtvaardigde verrijking): gedaagden zouden zich ongerechtvaardigd hebben verrijkt door Reddit’s technische beveiliging te omzeilen en zo toegang te krijgen tot actuele content, diensten en gebruikersdata. Zij zouden op die manier hebben geprofiteerd van Reddit’s investeringen in infrastructuur, beleid en gemeenschap, zonder enige vorm van compensatie. Dat is in strijd met de redelijkheid en billijkheid, aldus Reddit.
Civil conspiracy (samenspanning onrechtmatige daad): Reddit stelt dat Perplexity en SerpApi een zakelijke overeenkomst hebben gesloten met als doel Google’s beveiliging te omzeilen en op grote schaal Reddit-data te verkrijgen. Beide bedrijven zouden vervolgens concrete handelingen hebben verricht om dit plan uit te voeren, zoals het leveren en betalen van scrapingdiensten en het gebruik van de verkregen data in Perplexity’s commerciële producten. Volgens Reddit wist Perplexity bovendien dat het gebruik van Reddit-data ongeoorloofd was.

Door deze mix van auteursrechtelijke en civielrechtelijke claims zoekt Reddit maximale dekking: zowel juridisch als commercieel. Met name de claim voor civil conspiracy is opvallend in vergelijking met andere rechtszaken tegen AI-bedrijven en kan, als zij wordt bewezen, leiden tot gezamenlijke aansprakelijkheid voor eventuele gepleegde onrechtmatige daden.

Contractuele dimensie

De aanklacht benadrukt tot slot dat Reddit’s User Agreement en Public Content Policy commercieel gebruik van webdata verbieden zonder schriftelijke licentie. Aangezien Perplexity een dergelijke licentie nooit heeft verkregen, kwalificeert de dataverzameling volgens Reddit als contractbreuk. Daarmee sluit de zaak aan bij de eerdere procedure tegen Anthropic, waarin ook al werd gesteld dat het ongeoorloofd gebruik van Reddit-data in strijd was met de contractuele voorwaarden.

Impact en betekenis

De nadruk van deze zaak ligt niet op het gebruik van beschermde data, maar op de manier waarop die data is verkregen. Door de DMCA als grondslag te gebruiken, betoogt Reddit dat het verkrijgen van toegang tot beschermde content zelf een auteursrechtelijk relevante handeling kan zijn, zelfs als dat via een tussenpartij gebeurt. Als daarbij technische barrières worden doorbroken, kan sprake zijn van auteursrechtinbreuk.

Als de rechter Reddit volgt, kan dit een krachtig precedent scheppen: (AI-)bedrijven die langs technische omwegen toegang krijgen tot (openbare) websites met beschermde inhoud, plegen inbreuk. Daarbij kunnen zij zich niet verschuilen achter een tussenpartij. Zelfs indirecte dataverzameling via zoekmachines of API-diensten van derden kan namelijk als inbreuk worden beschouwd.

De gedaagden zullen waarschijnlijk benadrukken dat Google-zoekresultaten publiek toegankelijk zijn en dat het raadplegen daarvan niet gelijkstaat aan het “kraken” van beveiliging. Een uitspraak in het voordeel van Reddit kan in dat opzicht een fundamentele verschuiving veroorzaken: van een grotendeels open web naar een systeem waarin vrijwel elke vorm van data-toegang contractueel of technisch moet worden gelicentieerd.

De zaak staat niet op zichzelf. In september 2025 werd Perplexity ook al aangeklaagd door Britannica en Merriam-Webster wegens auteurs- en merkinbreuk, terwijl Reddit zoals gezegd eerder dit jaar een soortgelijk geschil voerde met Anthropic over contractbreuk. Los van de partijen in kwestie lopen er wereldwijd meer dan vijftig vergelijkbare rechtszaken. Hoewel die vooral draaien om AI-training op beschermde werken en de vraag of dat inbreuk oplevert, toont het geheel aan dat de opkomst van AI talloze onbeantwoorde juridische vragen met zich meebrengt.

AI-forum 2025/3

Google’s AI-summaries: een overzicht van alle klachten en procedures (antitrust, auteursrecht)

Dit artikel schept een overzicht van de belangrijkste juridische ontwikkelingen rond Google’s AI-samenvattingen, beter bekend als AI Overviews. De functie, wereldwijd uitgerold in 2024, plaatst bovenaan de zoekresultaten automatisch gegenereerde s...

De Europese Commissie bevestigt: ruimte om AI-modellen te trainen en gebruiken met persoonsgegevens

Update van het juridische speelveld voor persoonsgegevens en AI naar aanleiding van het Digital Omnibus Package van de Europese Commissie

AI-modellen werken op basis van gegevens. Dit geldt zowel voor de uiterst omvangrijke, veelal generatief inzet...

AI-Forum 2025 | 3

Wat betekent de recente GEMA v. OpenAI-uitspraak over AI-training op auteursrechtelijk beschermde werken voor de juridische praktijk, in het bijzonder de toepassing van de Digital Services Act? Hoe verhoudt training op persoonsgegevens zich tot he...

The GDPR as the building code for AI-systems

Dit essay verscheen ook in DCSP 2025/18&19.

Artificial Intelligence (AI) has entered our daily lives – or at least our newsfeeds. Each day brings new promises about how AI will either enhance society or destroy life as we know it (or potentially bo...

De AI Apply- en AI in Science Strategy: twee strategieën om van Europa een ‘AI Continent’ te maken.

De EU lijkt in te zien dat het achterloopt op AI-terrein ten opzichte van China en de Verenigde Staten. Slechts 13,5% van de Europese bedrijven maakt gebruik van deze technologie, en bij mkb’s – de ‘ruggengraat’ van de Europese economie – ligt dit...

Weet AI de rechter te overtuigen? Een casestudy over het AI-gegenereerde pleidooi

1. Inleiding

Het gebruik van een Large Language Model (hierna: LLM) zoals ChatGPT door procespartijen binnen de rechtspraak lijkt steeds vaker voor te komen. Zo vermoedde de rechtbank Den Haag in een recent verschenen vonnis het gebruik van ChatGPT...

Meester of machine? Professionele autonomie in het tijdperk van AI (onderzoeksresultaten)

Theorie geeft richting, maar de praktijk bepaalt de werkelijkheid. In het vorige deel van deze bijdrage stond het conceputele framework centraal dat ik ontwikkelde op basis van beperkte theorie. In dit tweede deel neem ik je mee in de praktijk en ...

AI-resurrection: juridische kaders en knelpunten bij het simuleren van overledenen

De opkomst van griefbots maakt het mogelijk om overleden personen digitaal te reconstrueren met behulp van AI. Steeds vaker gebruiken nabestaanden dergelijke systemen om hun rouw te verlichten, met alle psychologische gevolgen van dien. Dit artike...

Italiaanse AI-wet: de eerste EU-lidstaat met nationale wetgeving over kunstmatige intelligentie

In maart van dit jaar noemde premier Giorgia Meloni de komst van kunstmatige intelligentie de “grootste revolutie van onze tijd”. Volgens haar moest er daarom een “Italiaanse weg” worden ingeslagen om kunstmatige intelligentie te ontwikkelen, maar...

GEMA v. OpenAI: Duitse rechtbank zet punt achter ongelicentieerde generatieve AI-training

Op 29 september 2025 vond in München een zitting plaats die weleens het keerpunt in de discussie over generatieve AI en auteursrecht kan worden. OpenAI stond terecht tegenover de Duitse muziek-auteursrechtenorganisatie GEMA, die het bedrijf beschu...