— maandag 2 februari 2026 17:21 | 0 reacties , praat mee

Uitgevers richten pijlen op Wayback Machine in strijd tegen AI-scrapers

Uitgevers richten pijlen op Wayback Machine in strijd tegen AI-scrapers
© ANP / SOPA

Nieuwsuitgevers van The Guardian en The New York Times gaan hun toegang beperken tot The Internet Archive vanwege hun zorgen over AI-scraping, bericht journalistiek innovatieplatform NiemanLab. Laatste wijziging: 3 februari 2026, 10:06

AI-scraping, ook wel AI-crawling genoemd, is het geautomatiseerde verzamelen van informatie met behulp van kunstmatige intelligentie zoals machine learning om de data te begrijpen, categoriseren en structureren.

Uitgevers maken zich zorgen over het bijeen vegen van hun inhoud. Ze willen de toegang tot The Internet Archive beperken, omdat de AI-bots die nu het web afstruinen op zoek naar trainingsdata voor hun modellen, kunnen puitten uit data van The Internet Archive. Sommige uitgevers zien daarin een risico op auteursrechtenschending.

Wat is The Wayback Machine?
De Wayback Machine laat je de oudere versies van websites bekijken, door middel van opgeslagen snapshots. Doordat The Internet Archive op dat moment openbaar toegankelijke webcontent vastlegt voor de Wayback Machine, kunnen zij ook bij openbare journalistieke content.

En dát is precies wat de New York Times niet wil. Tegenover NiemanLab stelt de Times de bot van The Internet Archive te gaan blokkeren, omdat de Wayback Machine onbeperkte toegang biedt tot (snapshots van) de New York Times voor AI-bedrijven. Door mensen gemaakte journalistiek is waardevol en het intellectuele eigendom moet op een wettige manier gebruikt worden, aldus de Times.

Toen The Guardian onderzocht wie probeerde hun content te verzamelen, bleek uit logbestanden dat The Internet Archive een van de frequente crawlers is. De uitgever besloot daarom de toegang te beperken tot gepubliceerde artikelen te beperken.

Niet de Bad Guy
Toch zijn de Wayback Machine én The internet Archive geen kwaadwillenden. The Internet Archive heeft een publieke functie, vergelijkbaar met Wikipedia. OpenAI maakt daar gebruik (of misbruik) van. Journalisten zijn geholpen met een openbaar archief waarin informatie behouden blijft en er onderzoek kan worden gedaan naar het historische pagina’s.

Bekijk meer van

artificiële intelligentie
NVJ LID 26-05

Tip de redactie

Logo Publeaks Wil je Villamedia tippen, maar is dat te gevoelig voor een gewone mail? Villamedia is aangesloten bij Publeaks, het platform waarmee je veilig en volledig anoniem materiaal met de redactie kunt delen: publeaks.nl/villamedia

Praat mee