Privacy in the open: the Open Personal Data Corpus

Regelmatig lekken persoonlijke data uit gehackte websites. En ondanks dat we het allemaal over privacy hebben, vullen we onze persoonsgegevens in op allerlei webformulieren. Software zou persoonsgegevens kunnen minimaliseren, maar dat is nu nog lastig, mede omdat de definitie van persoonsgegevens weinig houvast biedt. Met het Open Personal Data Corpus (OPDC) bouwt dit project aan een dataset van teksten waarin persoonsgegevens worden aangeduid en gecategoriseerd, zodat met deze ‘Wikipedia van persoonsgegevens’ software geleerd kan worden om persoonsgegevens te herkennen.

Afbeelding: h heyerlein, Unsplash.com

Versterking van het internet Internetvrijheid & Privacy Pionier 2017