Rechtspraak
Reddit v. Perplexity: waar ligt de grens tussen open internet en onrechtmatige content-scraping?
Redactie
Reddit heeft een rechtszaak aangespannen tegen Perplexity AI en drie datascrapingbedrijven: SerpApi, Oxylabs en AWMProxy, wegens het op grote schaal kopiëren van Reddit-content voor commerciële AI-toepassingen. De stap volgt enkele maanden na een vergelijkbare procedure tegen AI-bedrijf Anthropic. De nieuwe aanklacht is gebaseerd op het Amerikaanse auteursrecht (Copyright Act) en wijkt af van andere AI-zaken doordat niet de trainingsfase, maar de dataverzameling zelf centraal staat. Reddit stelt dat het automatisch scrapen van beschermde content op zichzelf onrechtmatig is en beschuldigt de bedrijven van het omzeilen van technische beschermingsmaatregelen en het zonder toestemming gebruiken van auteursrechtelijk materiaal.
“Noord-Koreaanse” praktijken, aldus Reddit
Reddit beschuldigt de vier partijen (gedaagden) van het gezamenlijk verkrijgen van Reddit-data via ongeoorloofde scraping. Aangezien Reddit flink heeft geïnvesteerd in anti-scraping maatregelen, zoals IP-limieten, gebruikersidentificatie en CAPTCHA-systemen, zouden gedaagden hun aandacht hebben verlegd naar de zoekresultaten van Google (SERPs), waarin Reddit-berichten vaak zichtbaar zijn. Ook Google verbiedt automatische scraping, maar volgens Reddit hebben gedaagden de barrières van Google omzeild. De verzamelde gegevens zijn vervolgens gebruikt voor Perplexity’s answer engine AI.
Reddit stelt dat gedaagden, in het bijzonder SerpApi, Oxylabs en AWMProxy, in korte tijd miljarden zoekresultaten met Reddit-inhoud hebben opgevraagd. Deze informatie is volgens de aanklacht afkomstig van Google, dat op verzoek van Reddit technische gegevens heeft overgelegd over dataverkeer van de betrokken netwerken.
Daarnaast voerde Reddit een praktische test uit om te controleren of Perplexity daadwerkelijk toegang kreeg tot Reddit-data via Google. Op het platform werd een uniek bericht geplaatst dat nergens anders op internet bestond en uitsluitend via Google te vinden was. Kort daarna verscheen dezelfde tekst in Perplexity’s generatieve antwoorden. Volgens Reddit toont dit aan dat gedaagden Google’s zoekresultaten hebben gescrapet en dat Perplexity de verkregen data in zijn systeem gebruikte.
Hoewel Reddit gedaagden over één kam scheert, lijkt het bewijs voor daadwerkelijke samenwerking beperkt. De belangrijkste aanwijzing is dat op SerpApi’s website Perplexity wordt vermeld als “customer”. Daarnaast wijst Reddit erop dat de scrapingbedrijven zich openlijk profileren met het omzeilen van Google’s technische barrières.
Perplexity ontkent de aantijgingen. Het bedrijf stelt dat het uitsluitend openbare informatie samenvat en geen AI-modellen traint op Reddit-data. Volgens Perplexity probeert Reddit met deze rechtszaak de vrije toegang tot informatie op internet te beperken.
Kern van de zaak
Centraal staat de vraag of het automatisch verzamelen van publiek toegankelijke webdata een inbreuk op het auteursrecht kan opleveren wanneer dat gebeurt in strijd met technische en contractuele beperkingen. Reddit meent van wel en ziet zowel directe als indirecte auteursrechtelijke schendingen onder de DMCA. Dat betreft zowel Reddit’s eigen content als de bijdragen van gebruikers waarop Reddit licentierechten heeft. Door beperkingen te omzeilen, zouden de gedaagden de legitieme exploitatie van Reddit-data via betaalde licenties ondermijnen.
Juridische analyse
Naast de vermeende auteursrechtinbreuk beroept Reddit zich op meerdere civielrechtelijke grondslagen. Hieronder worden de verschillende claims beknopt toegelicht.
Auteursrechtelijke grondslag: DMCA-schending
De DMCA (17 U.S.C. § 1201) verbiedt het omzeilen van technologische maatregelen die toegang tot auteursrechtelijk beschermde werken beperken. Reddit stelt dat de gedaagden precies dat hebben gedaan:
-
SerpApi, Oxylabs en AWMProxy zouden beveiliging van zowel Reddit als Google hebben omzeild door proxy-netwerken en bots te gebruiken die menselijke gebruikers imiteren;
-
Perplexity zou de vruchten daarvan hebben geplukt door de gescrapete data te verwerken in haar commerciële AI-engine.
Reddit klaagt alle partijen aan voor “circumvention of technological measures” en voegt ten aanzien van SerpApi en Oxylabs twee aanvullende DMCA-bepalingen toe die het aanbieden van circumvention-technologie in het algemeen verbieden. SerpApi’s eigen marketing (“we bypass Google’s restrictions”) en producten als Ludicrous Speed Max worden aangehaald als bewijs dat het bedrijf tools aanbiedt die primair zijn ontworpen om beveiliging te doorbreken.
Deze benadering is opvallend: in andere AI-zaken ligt de focus veelal op fair use (of een werk mag worden gebruikt), terwijl Reddit hier stelt dat het al onrechtmatig is om een werk te betreden en/of te gebruiken als dat via omzeiling gebeurt.
Civielrechtelijke aanvulling
Naast de DMCA-claims bevat de aanklacht klassieke civielrechtelijke grondslagen:
-
Unfair competition (oneerlijke handelspraktijken): gedaagden zouden op oneerlijke wijze concurrentievoordeel behalen door technologische beveiliging te omzeilen en zo Reddit’s arbeid, investeringen en goodwill te misbruiken. Daarmee zouden zij niet alleen licentiekosten hebben vermeden, maar ook Reddit’s commerciële relaties met bedrijven als Google en OpenAI hebben ondermijnd en de waarde van het platform voor gebruikers en adverteerders hebben aangetast.
-
Unjust enrichment (ongerechtvaardigde verrijking): gedaagden zouden zich ongerechtvaardigd hebben verrijkt door Reddit’s technische beveiliging te omzeilen en zo toegang te krijgen tot actuele content, diensten en gebruikersdata. Zij zouden op die manier hebben geprofiteerd van Reddit’s investeringen in infrastructuur, beleid en gemeenschap, zonder enige vorm van compensatie. Dat is in strijd met de redelijkheid en billijkheid, aldus Reddit.
-
Civil conspiracy (samenspanning onrechtmatige daad): Reddit stelt dat Perplexity en SerpApi een zakelijke overeenkomst hebben gesloten met als doel Google’s beveiliging te omzeilen en op grote schaal Reddit-data te verkrijgen. Beide bedrijven zouden vervolgens concrete handelingen hebben verricht om dit plan uit te voeren, zoals het leveren en betalen van scrapingdiensten en het gebruik van de verkregen data in Perplexity’s commerciële producten. Volgens Reddit wist Perplexity bovendien dat het gebruik van Reddit-data ongeoorloofd was.
Door deze mix van auteursrechtelijke en civielrechtelijke claims zoekt Reddit maximale dekking: zowel juridisch als commercieel. Met name de claim voor civil conspiracy is opvallend in vergelijking met andere rechtszaken tegen AI-bedrijven en kan, als zij wordt bewezen, leiden tot gezamenlijke aansprakelijkheid voor eventuele gepleegde onrechtmatige daden.
Contractuele dimensie
De aanklacht benadrukt tot slot dat Reddit’s User Agreement en Public Content Policy commercieel gebruik van webdata verbieden zonder schriftelijke licentie. Aangezien Perplexity een dergelijke licentie nooit heeft verkregen, kwalificeert de dataverzameling volgens Reddit als contractbreuk. Daarmee sluit de zaak aan bij de eerdere procedure tegen Anthropic, waarin ook al werd gesteld dat het ongeoorloofd gebruik van Reddit-data in strijd was met de contractuele voorwaarden.
Impact en betekenis
De nadruk van deze zaak ligt niet op het gebruik van beschermde data, maar op de manier waarop die data is verkregen. Door de DMCA als grondslag te gebruiken, betoogt Reddit dat het verkrijgen van toegang tot beschermde content zelf een auteursrechtelijk relevante handeling kan zijn, zelfs als dat via een tussenpartij gebeurt. Als daarbij technische barrières worden doorbroken, kan sprake zijn van auteursrechtinbreuk.
Als de rechter Reddit volgt, kan dit een krachtig precedent scheppen: (AI-)bedrijven die langs technische omwegen toegang krijgen tot (openbare) websites met beschermde inhoud, plegen inbreuk. Daarbij kunnen zij zich niet verschuilen achter een tussenpartij. Zelfs indirecte dataverzameling via zoekmachines of API-diensten van derden kan namelijk als inbreuk worden beschouwd.
De gedaagden zullen waarschijnlijk benadrukken dat Google-zoekresultaten publiek toegankelijk zijn en dat het raadplegen daarvan niet gelijkstaat aan het “kraken” van beveiliging. Een uitspraak in het voordeel van Reddit kan in dat opzicht een fundamentele verschuiving veroorzaken: van een grotendeels open web naar een systeem waarin vrijwel elke vorm van data-toegang contractueel of technisch moet worden gelicentieerd.
De zaak staat niet op zichzelf. In september 2025 werd Perplexity ook al aangeklaagd door Britannica en Merriam-Webster wegens auteurs- en merkinbreuk, terwijl Reddit zoals gezegd eerder dit jaar een soortgelijk geschil voerde met Anthropic over contractbreuk. Los van de partijen in kwestie lopen er wereldwijd meer dan vijftig vergelijkbare rechtszaken. Hoewel die vooral draaien om AI-training op beschermde werken en de vraag of dat inbreuk oplevert, toont het geheel aan dat de opkomst van AI talloze onbeantwoorde juridische vragen met zich meebrengt.
AI-forum 2025/3
Rechtbank Amsterdam dwingt Meta tot echte keuzevrijheid onder de Digital Services Act
Civiele handhaving van Europees platformrecht
Recent oordeelde de Rechtbank Amsterdam dat Meta (het bedrijf achter Facebook en Instagram) Nederlandse gebruikers de mogelijkheid moet bieden om hun tijdlijn in chronologische volgorde te bekijken en...
GEMA v. OpenAI: Duitse rechtbank zet punt achter ongelicentieerde generatieve AI-training
Op 29 september 2025 vond in München een zitting plaats die weleens het keerpunt in de discussie over generatieve AI en auteursrecht kan worden. OpenAI stond terecht tegenover de Duitse muziek-auteursrechtenorganisatie GEMA, die het bedrijf beschu...
AI en aansprakelijkheid: een analyse van de zaak Raine v. OpenAI
1. Inleiding
De dood van de zestienjarige Adam Raine in april 2025 heeft geleid tot een van de meest spraakmakende rechtszaken tegen een AI-bedrijf tot nu toe. Zijn ouders hebben OpenAI en CEO Sam Altman aangeklaagd wegens productaansprakelijkhei...
Nationaal Data & AI Congres – donderdag 5 februari 2026
Wat betekenen de snelle technologische ontwikkelingen op het gebied van data en artificiële intelligentie voor het juridische en bestuurlijke domein? Tijdens het Nationaal Data & AI Congres op donderdag 5 februari 2026 bespreken we samen met Astri...
Google’s AI-summaries: een overzicht van alle klachten en procedures (antitrust, auteursrecht)
Dit artikel schept een overzicht van de belangrijkste juridische ontwikkelingen rond Google’s AI-samenvattingen, beter bekend als AI Overviews. De functie, wereldwijd uitgerold in 2024, plaatst bovenaan de zoekresultaten automatisch gegenereerde s...
De AI Apply- en AI in Science Strategy: twee strategieën om van Europa een ‘AI Continent’ te maken.
De EU lijkt in te zien dat het achterloopt op AI-terrein ten opzichte van China en de Verenigde Staten. Slechts 13,5% van de Europese bedrijven maakt gebruik van deze technologie, en bij mkb’s – de ‘ruggengraat’ van de Europese economie – ligt dit...
Reddit v. Perplexity: waar ligt de grens tussen open internet en onrechtmatige content-scraping?
Reddit heeft een rechtszaak aangespannen tegen Perplexity AI en drie datascrapingbedrijven: SerpApi, Oxylabs en AWMProxy, wegens het op grote schaal kopiëren van Reddit-content voor commerciële AI-toepassingen. De stap volgt enkele maanden na een ...
