Technische maatregelen (deel V): contentherkenning
Deze week besteden we op Future of Copyright aandacht aan technische middelen om piraterij te bestrijden. Deze middelen kunnen door ISPs worden ingezet om piraterij tegen te gaan, maar ze zijn niet onomstreden. Vandaar dat Future of Coyright de voor- en nadelen op een rij zet. Vandaag deel V: Filtering met behulp van contentherkenning.
Een laatste manier om ongewenste en illegale content te bestrijden is door het technisch mogelijk te maken om bestanden automatisch te herkennen. Wanneer bestanden automatisch herkend kunnen worden kan de doorgifte ervan geblokkeerd worden (filtering). Ook is het mogelijk om op p2p netwerken of Usenet te zoeken naar content die illegaal wordt verspreid (scanning). Om een bestand herkenbaar te maken kunnen verschillende technieken worden gebruikt waaronder hash-matching, fingerprinting en watermarking.
Bij hash matching wordt er een rekenkundige formule toegepast op een bestand om zo tot een uniek getal te komen (een hash-waarde). Deze hash-waarde is uniek voor dit bestand en alle kopieën ervan. Door hash-waardes van bestanden te berekenen en deze tegen een database met bekende hash-waarden te houden kan bepaald worden of er match is. Een match betekent dat het gaat om een illegaal aangeboden werk. Een hashwaarde is uniek voor de bits waaruit het bestand wordt opgebouwd, niet de inhoud. Wanneer een bestand bijvoorbeeld wordt geconverteerd van .mpg naar .avi zal de hashwaarde niet langer overeenkomen.
Fingerprinting valt qua proces te vergelijken met hash-matching. Maar in plaats van de bits te herkennen wordt via fingerprinting de inhoud van een bestand herkend. De fingerprint wordt aan het originele bestand toegevoegd. Zelfs als het bestand wordt veranderd, blijft de fingerprint intact. Net als bij hash-matching wordt de fingerprint van een bestand vergeleken met bekende fingerprints in een database.
Bij watermarking wordt aan het bestand een (liefst) onzichtbaar watermerk toegevoegd. Dit watermerk is uniek geassocieerd met het bestand. Wanneer een bestand wordt gevonden kan aan de hand van het watermerk worden bepaald om welk bestand het gaat. Hiertoe wordt het watermerk gechecked tegen een database met watermerken.
Content herkenning heeft als grote voordeel dat schadelijke en illegale content wordt geblokkeerd of herkend, terwijl de legale transfer van bestanden niet wordt gehinderd. Maar het inrichten van een effectief systeem voor het herkennen van content is niet eenvoudig. Hoewel diverse providers content herkenning gebruiken voor het filteren van kinderpornografie, is er voor het filteren van auteursrechtelijk beschermde werken nog geen eenduidige oplossing. Dit heeft onder andere te maken met het feit dat het bij het verspreiden van auteursrechtelijk beschermde werken gaat het om meer bestanden en bestanden die groter zijn (waardoor ze vaak in delen worden getransporteerd). Dit maakt het herkennen van bestanden niet alleen moeilijker, maar bovenal is er vele malen meer rekenkracht voor nodig.
ISPs geven aan dat zij weliswaar content herkenning zouden kunnen inzetten, maar dat zij niet de kosten voor onder andere de benodigde rekenkracht niet (alleen) kunnen dragen. Daarnaast vormt het feit dat content herkenning voor auteursrechtelijk beschermde werken momenteel niet gestandaardiseerd is een probleem. Hierdoor moeten ISPs verschillende systemen inzetten en met verschillende rechthebbenden en hardware/software leveranciers in conclaaf. Een samenwerkingsverband tussen diverse rechthebbenden en leveranciers zou mogelijk een oplossing vormen, omdat de ISPs dan een centraal aanspreekpunt hebben en toegang tot een grotere database met controle bestanden.
