Home Nieuws AI-scraping is zijn eigen mediabedrijf geworden

AI-scraping is zijn eigen mediabedrijf geworden

4
0
AI-scraping is zijn eigen mediabedrijf geworden

Een van de eerdere uitspraken op dit gebied illustreert dit punt. Een groep auteurs, waaronder komiek Sarah Silverman, OpenAI aangeklaagd ver terug in 2023 omdat ze zich hun boeken zonder compensatie hadden toegeëigend. Een rechter verwierp later verschillende claims van de auteurs omdat de rechtszaak geen specifieke output identificeerde die directe kopieën waren. Het blijkt alleen maar erop te wijzen dat a groot taalmodel (LLM) is getraind in uw materiaal is niet voldoende; u moet laten zien dat het resultaten oplevert die u zaken ontnemen.

Het uitgangsprobleem

Rechtszaken over auteursrecht, zoals de Silverman-zaak, zijn vaak afhankelijk van het aantonen van specifieke gevallen van scraping en reproductie. Het probleem is dat een groot deel van deze activiteit zich afspeelt op het gebied van bots: het scrapen gebeurt snel, stil en op grote schaal. En terwijl de output van grote, publieke gerichte AI diensten zoals ChatGPT, TweelingEn Verbijstering zijn er voor iedereen zichtbaar, er is een hele schaduwindustrie van massale AI-scraping die dat niet is.

{“blockType”:mv-promo-block”,”data”:{“imageDesktopUrl”https://images.fastcompany.com/image/upload/f_webp,q_auto,c_fit/wp-cms-2/2025/03/media-copilot.png”, “imageMobileUrl”:https ://images.fastcompany.com/image/upload/f_webp,q_auto,c_fit/wp-cms-2/2025/03/fe289316- bc4f-44ef-96bf-148b3d8578c1_1440x1440.png”,”wenkbrauw” “, “headline”:u003Cstrongu003EAbonneren naar The Media Copilotu003C/strongu003E”,”dek ‘Wilt u meer weten over hoe AI de media verandert? Mis nooit meer een update van Pete Pachal door u aan te melden voor The Media Copilot. Ga voor meer informatie naar u003Ca href=u0022https://mediacopilot.substack.com/u0022u003Emediacopilot.substack.comu003C/au003E”,”subhed>

,

“,”ctaText <Het is een publiek geheim dat AI-bedrijven soms gegevens verkrijgen van externe makelaars en analisten uit de media-industrie Matthew Scott Goldstein publiceerde er onlangs een uitgebreid rapport over. De conclusies, zoals gerapporteerd in Digidagzijn eye-openend: minstens 21 bedrijven, waarvan er verschillende gefinancierd zijn voor honderden miljoenen dollars, schrapen routinematig de inhoud van uitgevers zonder ervoor te betalen, en verkopen hun ‘datadiensten’ aan klanten zoals OpenAI, Amazon en zelfs andere uitgevers zoals The Telegraph.

Het rapport laat zien wat de ‘output’ is als scraping op grote schaal is toegestaan: miljoenenbedrijven die zijn gebouwd rond het parseren van internetgegevens voor bots en agenten, het indexeren van die inhoud en het verkopen ervan. Dit zijn geen bekende bedrijven; ze hebben namen als Parallel AI, Exa en Bright Data. Goldstein wijst erop dat ze niet verlegen zijn over wat ze doen: Hoewel ze recent zijn Wall Street Journal-profiel beschrijft Parallelle AI als een platform “gewijd aan het bedienen van AI-agenten”, hij karakteriseert het als een “schraperbedrijf met beter branding.”

Zoals het gezegde luidt: laat mij de prikkels zien, en ik zal u de uitkomst laten zien. En niet te vergeten de tegenslagen in auteursrechtzaken bij de rechter het afwijzen door de huidige regering van zorgen over het auteursrechtis de boodschap duidelijk: er zijn weinig tot geen gevolgen aan ongeoorloofd schrapen, en over het algemeen zijn de wettelijke en technische mechanismen die dit regelen standaard gericht op een grotere toegang voor AI-systemen.

De bots blokkeren of voor ze bouwen?

Deze realiteit creëert een existentieel dilemma onder mediabedrijven. Blokkeert u agressief de toegang van bots tot uw inhoud, of laat u ze dat doen? Dit laatste betekent in wezen dat je de strijd moet opgeven (of in ieder geval anderen voor je moet laten vechten), maar het haalt je ook uit het spel van meppen met AI-schrapers. Wat nog belangrijker is, het geeft u de vrijheid om een ​​bedrijf op te bouwen rond het idee dat AI uw inhoud opneemt en opnieuw gebruikt.

Ik geloof eigenlijk niet dat deze twee perspectieven zo tegenstrijdig zijn als ze lijken. Ja, auteursrechthouders moeten hun intellectuele eigendomsrechten laten gelden, maar ze moeten ook kampen met een toekomst waarin AI-engines een essentieel onderdeel zijn van de contentstrategie. AI is tegelijkertijd een distributiekanaal, een tussenpersoon en een publiek.

Hoe ziet een weloverwogen aanpak van het schraap-ecosysteem eruit? Ik zie vijf componenten, die niet allemaal voor elk mediabedrijf beschikbaar zullen zijn:

  1. Word beter in het blokkeren van bots: Het beschermen van uw IE vereist zowel technische als juridische componenten. De meeste grote uitgevers blokkeren bots, tenminste op papier, maar agressief zijn betekent dat je verder gaat dan aanpassingen aan het robots-uitsluitingsprotocol (de instructies die elke site heeft voor bots die hun site proberen te scrapen, die vaak worden genegeerd). Neil Vogel, CEO van People Inc., bijvoorbeeld heeft gezegd zijn bedrijf moest zeer geavanceerd worden in het blokkeren van ongeautoriseerde bots.
    De meeste uitgevers beschikken niet over dezelfde bronnen. Er zijn echter technische partners die kunnen helpen, en infrastructuurbedrijven houden ervan Wolkenvlam zijn opgeschoven naar standaarden die auteursrechten beschermen. Zelfs als geavanceerde blokkeertechnologie geen optie is, kun je nog steeds informatie verzamelen. Kijk niet alleen naar het botverkeer naar uw site; u moet AI-systemen regelmatig controleren om te achterhalen waar uw inhoud is toegeëigend en misbruikt.
  2. Oefen goede GEO: Het lijkt misschien contra-intuïtief, maar ongeacht of uw site wel of niet wordt gescrapt, moet u uw inhoud zo vriendelijk mogelijk maken voor AI-scrapers. De kwestie van toegang is binair: ze moeten schrappen of niet. Het probleem met negeren generatieve motoroptimalisatie (GEO) is dat, als uw inhoud moeilijk te interpreteren is voor bots, dit geldt voor zowel geautoriseerde als niet-geautoriseerde bots.
    Er zijn verschillende voordelen verbonden aan het beoefenen van goede GEO. Om te beginnen is er de realiteit dat er sprake is van scraping, dus je moet meedoen aan samenvattingen, zelfs als je er niet graag bij bent zonder daarvoor gecompenseerd te worden. U kunt net zo goed de zichtbaarheid en het (kleine) gekwalificeerde verkeer krijgen dat daaruit voortvloeit. Bovendien creëert het een papieren spoor voor uw proactieve audits, en helpt het mogelijk uw waarde in eventuele juridische procedures te bewijzen. Ten slotte is het essentieel als u een makelaar in huis of MCP-server voor uw inhoud.
  3. Verander uw bedrijfsmodel: Ik heb hier uitgebreid over geschrevenmaar de realiteit is dat het mediamodel uit het Google-tijdperk snel aan het afnemen is. Dat betekent dat elk bedrijf dat zich primair richt op het genereren van inkomsten uit anoniem verkeer, krimpt. Er moeten nieuwe inkomstenstromen worden gestimuleerd, waaronder evenementen, abonnementen, data en meer. Ik weet het – makkelijker gezegd dan gedaan, maar het diversifiëren van inkomsten moet een religie worden onder advertentie-afhankelijke uitgevers.
  4. Sue: Dit is uiteraard niet voor iedereen een optie. Zeer weinig mediabedrijven beschikken over de middelen om een ​​OpenAI of een Perplexity voor de rechter aan te pakken. Maar het rapport over de schaduwmarkt van schrapen op industriële schaal brengt een groep bedrijven aan het licht die tot nu toe grotendeels onzichtbaar waren. Gezien wat ze openlijk doen, hoeveel geld ermee gemoeid is en de inzet voor uitgevers, zou het verrassend zijn als er niet meer juridische stappen zouden volgen.
  5. Lobby voor regulering: Hoewel regulering op federaal niveau in de huidige omgeving onwaarschijnlijk lijkt, proberen veel staten AI te reguleren, onder meer door middel van transparantie van trainingsgegevens en regels voor openbaarmaking. En misschien is er niet eens een grootschalige herziening van de auteursrechtwetgeving nodig. De loutere vereiste voor bots om zichzelf goed identificeren zou ervoor zorgen dat sommige bots zich niet effectief kunnen voordoen als mensen, waardoor veel robuustere bestuursmechanismen mogelijk zijn.

Herbevestigingsbureau

Als AI-bots Als ze doorgaan met het ‘opeten van het internet’, kunnen uitgevers een gevoel van hulpeloosheid ervaren – dat schrappen gewoon weer een brutale onvermijdelijkheid is die moet worden doorstaan. Daar zit een kern van waarheid in. Maar onvermijdelijkheid mag geen excuus voor verlamming worden. In een wereld die steeds meer wordt gedomineerd door agenten, moeten uitgevers hun eigen keuzevrijheid opnieuw laten gelden: beschermen wat ze kunnen, zich aanpassen waar dat moet, en weigeren de toekomst van hun werk volledig te laten beslissen door dezelfde bedrijven die het hebben geschrapt.

{“blockType”:mv-promo-block”,”data”:{“imageDesktopUrl”https://images.fastcompany.com/image/upload/f_webp,q_auto,c_fit/wp-cms-2/2025/03/media-copilot.png”, “imageMobileUrl”:https ://images.fastcompany.com/image/upload/f_webp,q_auto,c_fit/wp-cms-2/2025/03/fe289316- bc4f-44ef-96bf-148b3d8578c1_1440x1440.png”,”wenkbrauw” “, “headline”:u003Cstrongu003EAbonneren naar The Media Copilotu003C/strongu003E”,”dek ‘Wilt u meer weten over hoe AI de media verandert? Mis nooit meer een update van Pete Pachal door u aan te melden voor The Media Copilot. Ga voor meer informatie naar u003Ca href=u0022https://mediacopilot.substack.com/u0022u003Emediacopilot.substack.comu003C/au003E”,”subhed>

,

“,”ctaText <Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in