Copyclear: claiming back the public domain

Welke content is nou wel en welke niet vrij te gebruiken? Auteursrecht blijft een ingewikkeld onderwerp. En dan is het ook nog eens zo dat veel materiaal verkeerd staat aangemerkt. Beschermd materiaal valt 70 jaar na het overlijden van de maker vrij, maar dit wordt vaak niet bijgehouden, waardoor het onterecht ‘achter slot en grendel’ blijft. Copyclear is een tool die data- of beeldbanken geautomatiseerd kan analyseren op vrijgevallen content en deze toevoegt aan bijvoorbeeld Wikidata, de wereldwijde database van Wikipedia. Hiermee komt er een stroom aan foto’s, films, kunstwerken en boeken in het publieke domein, waar iedereen vrij gebruik van kan maken. (Call 1 - 2016)

Het project is afgerond (juli 2017). Er is een Proof of Concept ontwikkeld en getest. De resultaten overtroffen de verwachting. CopyClear laat zien dat via een gestructureerde aanpak een actuele status van auteursrechten van een museumcollectie te achterhalen zijn. Bij een pilotmuseum was dit voor maar liefst 97% van de 15.000 doorgenomen objecten het geval. Het beschikbaar stellen van deze informatie via Wikidata heeft bijgedragen aan het vergroten van het aantal werken in het publiek domein. Niet alleen data is toegevoegd aan Wikidata, maar ook een query om automatisch aan te duiden dat de datum van overlijden voor 1946 ligt (waarna doorgaans het materiaal auteursrechtenvrij zou moeten zijn, uitzonderingen daargelaten). Wikidata is verrijkt met een aantal nieuwe ‘properties’ (kenmerken), zoals auteursrechthebbende, reproductierechthebbende, kunstenaars id, door bots gegenereerd en aangevuld. Inmiddels is er een aantal databases gekoppeld aan de tool. De broncode van de software is onder een open source licentie via Gitlab gepubliceerd.

Tech for Good Open Data & Open Content Pionier 2016