Terug naar overzicht

Rechtspraak

Reddit v. Perplexity: waar ligt de grens tussen open internet en onrechtmatige content-scraping?

Reddit heeft een rechtszaak aangespannen tegen Perplexity AI en drie datascrapingbedrijven: SerpApi, Oxylabs en AWMProxy, wegens het op grote schaal kopiëren van Reddit-content voor commerciële AI-toepassingen. De stap volgt enkele maanden na een vergelijkbare procedure tegen AI-bedrijf Anthropic. De nieuwe aanklacht is gebaseerd op het Amerikaanse auteursrecht (Copyright Act) en wijkt af van andere AI-zaken doordat niet de trainingsfase, maar de dataverzameling zelf centraal staat. Reddit stelt dat het automatisch scrapen van beschermde content op zichzelf onrechtmatig is en beschuldigt de bedrijven van het omzeilen van technische beschermingsmaatregelen en het zonder toestemming gebruiken van auteursrechtelijk materiaal.

 

“Noord-Koreaanse” praktijken, aldus Reddit

 

Reddit beschuldigt de vier partijen (gedaagden) van het gezamenlijk verkrijgen van Reddit-data via ongeoorloofde scraping. Aangezien Reddit flink heeft geïnvesteerd in anti-scraping maatregelen, zoals IP-limieten, gebruikersidentificatie en CAPTCHA-systemen, zouden gedaagden hun aandacht hebben verlegd naar de zoekresultaten van Google (SERPs), waarin Reddit-berichten vaak zichtbaar zijn. Ook Google verbiedt automatische scraping, maar volgens Reddit hebben gedaagden de barrières van Google omzeild. De verzamelde gegevens zijn vervolgens gebruikt voor Perplexity’s answer engine AI.

 

Reddit stelt dat gedaagden, in het bijzonder SerpApi, Oxylabs en AWMProxy, in korte tijd miljarden zoekresultaten met Reddit-inhoud hebben opgevraagd. Deze informatie is volgens de aanklacht afkomstig van Google, dat op verzoek van Reddit technische gegevens heeft overgelegd over dataverkeer van de betrokken netwerken.

 

 

Daarnaast voerde Reddit een praktische test uit om te controleren of Perplexity daadwerkelijk toegang kreeg tot Reddit-data via Google. Op het platform werd een uniek bericht geplaatst dat nergens anders op internet bestond en uitsluitend via Google te vinden was. Kort daarna verscheen dezelfde tekst in Perplexity’s generatieve antwoorden. Volgens Reddit toont dit aan dat gedaagden Google’s zoekresultaten hebben gescrapet en dat Perplexity de verkregen data in zijn systeem gebruikte.

 

Hoewel Reddit gedaagden over één kam scheert, lijkt het bewijs voor daadwerkelijke samenwerking beperkt. De belangrijkste aanwijzing is dat op SerpApi’s website Perplexity wordt vermeld als “customer”. Daarnaast wijst Reddit erop dat de scrapingbedrijven zich openlijk profileren met het omzeilen van Google’s technische barrières.

 

Perplexity ontkent de aantijgingen. Het bedrijf stelt dat het uitsluitend openbare informatie samenvat en geen AI-modellen traint op Reddit-data. Volgens Perplexity probeert Reddit met deze rechtszaak de vrije toegang tot informatie op internet te beperken.

 

Kern van de zaak

 

Centraal staat de vraag of het automatisch verzamelen van publiek toegankelijke webdata een inbreuk op het auteursrecht kan opleveren wanneer dat gebeurt in strijd met technische en contractuele beperkingen. Reddit meent van wel en ziet zowel directe als indirecte auteursrechtelijke schendingen onder de DMCA. Dat betreft zowel Reddit’s eigen content als de bijdragen van gebruikers waarop Reddit licentierechten heeft. Door beperkingen te omzeilen, zouden de gedaagden de legitieme exploitatie van Reddit-data via betaalde licenties ondermijnen.

 

Juridische analyse

 

Naast de vermeende auteursrechtinbreuk beroept Reddit zich op meerdere civielrechtelijke grondslagen. Hieronder worden de verschillende claims beknopt toegelicht.

 

Auteursrechtelijke grondslag: DMCA-schending

 

De DMCA (17 U.S.C. § 1201) verbiedt het omzeilen van technologische maatregelen die toegang tot auteursrechtelijk beschermde werken beperken. Reddit stelt dat de gedaagden precies dat hebben gedaan:

 

  • SerpApi, Oxylabs en AWMProxy zouden beveiliging van zowel Reddit als Google hebben omzeild door proxy-netwerken en bots te gebruiken die menselijke gebruikers imiteren;

  • Perplexity zou de vruchten daarvan hebben geplukt door de gescrapete data te verwerken in haar commerciële AI-engine.

 

Reddit klaagt alle partijen aan voor “circumvention of technological measures” en voegt ten aanzien van SerpApi en Oxylabs twee aanvullende DMCA-bepalingen toe die het aanbieden van circumvention-technologie in het algemeen verbieden. SerpApi’s eigen marketing (“we bypass Google’s restrictions”) en producten als Ludicrous Speed Max worden aangehaald als bewijs dat het bedrijf tools aanbiedt die primair zijn ontworpen om beveiliging te doorbreken.

 

Deze benadering is opvallend: in andere AI-zaken ligt de focus veelal op fair use (of een werk mag worden gebruikt), terwijl Reddit hier stelt dat het al onrechtmatig is om een werk te betreden en/of te gebruiken als dat via omzeiling gebeurt.

 

Civielrechtelijke aanvulling

 

Naast de DMCA-claims bevat de aanklacht klassieke civielrechtelijke grondslagen:

 

  • Unfair competition (oneerlijke handelspraktijken): gedaagden zouden op oneerlijke wijze concurrentievoordeel behalen door technologische beveiliging te omzeilen en zo Reddit’s arbeid, investeringen en goodwill te misbruiken. Daarmee zouden zij niet alleen licentiekosten hebben vermeden, maar ook Reddit’s commerciële relaties met bedrijven als Google en OpenAI hebben ondermijnd en de waarde van het platform voor gebruikers en adverteerders hebben aangetast.

  • Unjust enrichment (ongerechtvaardigde verrijking): gedaagden zouden zich ongerechtvaardigd hebben verrijkt door Reddit’s technische beveiliging te omzeilen en zo toegang te krijgen tot actuele content, diensten en gebruikersdata. Zij zouden op die manier hebben geprofiteerd van Reddit’s investeringen in infrastructuur, beleid en gemeenschap, zonder enige vorm van compensatie. Dat is in strijd met de redelijkheid en billijkheid, aldus Reddit.

  • Civil conspiracy (samenspanning onrechtmatige daad): Reddit stelt dat Perplexity en SerpApi een zakelijke overeenkomst hebben gesloten met als doel Google’s beveiliging te omzeilen en op grote schaal Reddit-data te verkrijgen. Beide bedrijven zouden vervolgens concrete handelingen hebben verricht om dit plan uit te voeren, zoals het leveren en betalen van scrapingdiensten en het gebruik van de verkregen data in Perplexity’s commerciële producten. Volgens Reddit wist Perplexity bovendien dat het gebruik van Reddit-data ongeoorloofd was.

 

Door deze mix van auteursrechtelijke en civielrechtelijke claims zoekt Reddit maximale dekking: zowel juridisch als commercieel. Met name de claim voor civil conspiracy is opvallend in vergelijking met andere rechtszaken tegen AI-bedrijven en kan, als zij wordt bewezen, leiden tot gezamenlijke aansprakelijkheid voor eventuele gepleegde onrechtmatige daden.

 

Contractuele dimensie

 

De aanklacht benadrukt tot slot dat Reddit’s User Agreement en Public Content Policy commercieel gebruik van webdata verbieden zonder schriftelijke licentie. Aangezien Perplexity een dergelijke licentie nooit heeft verkregen, kwalificeert de dataverzameling volgens Reddit als contractbreuk. Daarmee sluit de zaak aan bij de eerdere procedure tegen Anthropic, waarin ook al werd gesteld dat het ongeoorloofd gebruik van Reddit-data in strijd was met de contractuele voorwaarden.

 

Impact en betekenis

De nadruk van deze zaak ligt niet op het gebruik van beschermde data, maar op de manier waarop die data is verkregen. Door de DMCA als grondslag te gebruiken, betoogt Reddit dat het verkrijgen van toegang tot beschermde content zelf een auteursrechtelijk relevante handeling kan zijn, zelfs als dat via een tussenpartij gebeurt. Als daarbij technische barrières worden doorbroken, kan sprake zijn van auteursrechtinbreuk.

 

Als de rechter Reddit volgt, kan dit een krachtig precedent scheppen: (AI-)bedrijven die langs technische omwegen toegang krijgen tot (openbare) websites met beschermde inhoud, plegen inbreuk. Daarbij kunnen zij zich niet verschuilen achter een tussenpartij. Zelfs indirecte dataverzameling via zoekmachines of API-diensten van derden kan namelijk als inbreuk worden beschouwd.

 

De gedaagden zullen waarschijnlijk benadrukken dat Google-zoekresultaten publiek toegankelijk zijn en dat het raadplegen daarvan niet gelijkstaat aan het “kraken” van beveiliging. Een uitspraak in het voordeel van Reddit kan in dat opzicht een fundamentele verschuiving veroorzaken: van een grotendeels open web naar een systeem waarin vrijwel elke vorm van data-toegang contractueel of technisch moet worden gelicentieerd.

 

De zaak staat niet op zichzelf. In september 2025 werd Perplexity ook al aangeklaagd door Britannica en Merriam-Webster wegens auteurs- en merkinbreuk, terwijl Reddit zoals gezegd eerder dit jaar een soortgelijk geschil voerde met Anthropic over contractbreuk. Los van de partijen in kwestie lopen er wereldwijd meer dan vijftig vergelijkbare rechtszaken. Hoewel die vooral draaien om AI-training op beschermde werken en de vraag of dat inbreuk oplevert, toont het geheel aan dat de opkomst van AI talloze onbeantwoorde juridische vragen met zich meebrengt.

 

AI-forum 2025/3