Webscraping is een hulpmiddel, geen misdaad

hoge Raad

mevrouw Tech | Pixabay





Als verslaggever die kan coderen, kan ik gemakkelijk informatie verzamelen van websites en sociale media-accounts verhalen te vinden. Het enige wat ik hoef te doen is een paar regels code schrijven die de ether ingaan, websites openen en de gegevens downloaden die er al publiekelijk over beschikbaar zijn. Dit proces wordt schrapen genoemd.

Maar er is een berekening die ik in mijn hoofd maak wanneer ik begin met het nastreven van een verhaal dat moet worden geschraapt: is dit verhaal de moeite waard naar de gevangenis gaan voor ?

Ik heb het niet over het hacken van de ommuurde databases van de CIA. Ik heb het over het gebruik van een script om informatie te verzamelen waartoe ik als dagelijkse internetconsument toegang heb, zoals openbare Instagram-berichten of tweets die een bepaalde hashtag gebruiken.



Geneesmiddelenbedrijven mogen geen favorieten spelen bij het verlenen van toegang tot experimentele covid-19-behandelingen. De wet - niet roem of macht - moet bepalen wie niet-goedgekeurde medicijnen mag proberen buiten klinische proeven om.

Mijn zorg is niet ongegrond. Een vaag geschreven Amerikaanse wet genaamd de Wet op computerfraude en -misbruik maakt toegang tot dit soort informatie op programmatische manieren een potentiële misdaad. De decennia-oude wet werd ingevoerd nadat wetgevers de film uit 1983 Oorlog spellen en besloot dat de VS een anti-hackingwet nodig had die iedereen verbiedt een computer te gebruiken zonder autorisatie of het overschrijden van geautoriseerde toegang.

Hoewel de wet misschien goedbedoeld was en is gebruikt om mensen te vervolgen die dingen van hun werksystemen downloaden die ze niet zouden mogen downloaden, betrapt ze ook veel andere mensen in het wijdverbreide netwerk, waaronder academici, onderzoekers, en journalisten.

Wat betekent het overschrijden van geautoriseerde toegang in een tijdperk van sociale media? Overschrijdt een medewerker die voor zijn werk toegang heeft tot een database met wetenschappelijke tijdschriften en deze voor privédoeleinden gebruikt de toegestane toegang? Begaat een verslaggever zoals ik die informatie verzamelt met behulp van geautomatiseerde processen en haar eigen Facebook-account een misdaad?



Tot nu toe zijn interpretaties van de wet van rechtszaak naar rechtszaak gegaan, waarbij we op verschillende rechters hebben vertrouwd om ons een betere definitie te geven van wat het precies betekent om iemands geautoriseerde toegang tot informatie te overschrijden. Maar binnenkort zal het Amerikaanse Hooggerechtshof... regel over de wet voor de eerste keer, in het geval Van Buren v. United States . Nathan Van Buren, een politieagent, had voor zijn werk toegang tot vertrouwelijke databases en verkocht informatie die hij daar opzocht aan een derde partij. De rechtbank hoorde de pleidooien op 30 november en kon haar beslissing elke dag bekendmaken.

Van oneerlijke prijzen op Amazon naar haatdragende taal op Facebook , kunnen veel zakelijke wandaden worden getraceerd via de platforms waarop we grote delen van ons leven uitvoeren. En de enorme digitale voetafdruk die mensen online produceren, waarvan een groot deel openbaar beschikbaar is, kan ons helpen datalekken te dichten en gebieden te onderzoeken die anders moeilijk te begrijpen zouden zijn.



Zoals de kunstenaar en technologie-expert Mimi Onuoha opmerkte in haar aangrijpende stuk De bibliotheek met ontbrekende datasets :

|__+_|

Het verzamelen van gegevens is duur en omslachtig, maar het is ook een belangrijk hulpmiddel om systemische onrechtvaardigheden te ontdekken en aan het licht te brengen. Welke gegevens we belangrijk genoeg vinden om te verzamelen, wordt vaak overgelaten aan machtige entiteiten - regeringen en bedrijven - die niet altijd rekening houden met de meest kwetsbare mensen van de samenleving.

Als Chinese overheidsfunctionarissen geen informatie publiceren over de kampen waar moslimminderheden worden vastgehouden, kunnen onderzoekers misschien informatie van Google maps om de omvang van dit probleem te benaderen. Als daders oorlogsmisdaden niet toegeven, maar over hen posten op sociale media, aanklagers en mensenrechtenonderzoekers kunnen nog steeds zaken tegen hen opzetten.



Moeten bedrijven als Facebook het juridische beroep hebben om academisch onderzoek stop te zetten? Moet er een uitzondering komen wanneer webscraping de enige manier is om gegevens te verzamelen die onderzoekers, academici en journalisten helpen bij het diagnosticeren van de kwalen van onze samenleving?

Twitter heeft mogelijk een weg vooruit gemodelleerd. Rekening houdend met zijn rol in de verspreiding van verkeerde informatie rond de Amerikaanse verkiezingen van 2016, besloot het bedrijf speciale toegang tot gegevens te creëren speciaal voor academici en onderzoekers . Hoewel het bedrijf nog steeds de wenkbrauwen fronst bij schrapen, geeft deze stap aan dat het erkent hoe belangrijk de gegevens zijn.

Misschien kunnen wetgevers dat ook.

Lam Thuy Vo is een senior verslaggever bij BuzzFeed News, waar ze verhalen heeft gerapporteerd over verkeerde informatie, haat online en platformgerelateerde aansprakelijkheid. Haar boek Mijnbouw sociale media was uitgegeven door No Starch Press eind 2019.

zich verstoppen