Gegevensanonimisering: gebruik persoonlijke gegevens EN respecteer de privacy

Klik voor meer informatie over auteur Stephan Kessler.

Met de huidige informatietechnologie kunnen veel organisaties gegevens van ongekende omvang en complexiteit genereren, integreren, opslaan en analyseren. In veel gevallen zijn dit persoonsgegevens en is het gebruik ervan beperkt volgens privacywet- en regelgeving. In 2018 introduceerde de Europese Unie de Algemene Verordening Gegevensbescherming (AVG), die de verwerking van gegevens beperkt tot toestemming van de betrokken persoon of een wederzijds overeengekomen contract. Soortgelijke wetten zijn ook van kracht of worden momenteel aangenomen in andere landen, zoals de VS, waar de California Consumer Privacy Act (CCPA) ging op 1 juli in handhaving. Naast de juridische en regelgevende implicaties, moeten organisaties aantonen dat ze voorzichtig omgaan met persoonsgegevens in tijden waarin privacy en veiligheid steeds belangrijker worden. Met dit in gedachten moeten organisaties op de hoogte blijven van best practices en technologieën voor het anonimiseren van gegevens.

Tijdens het analyseren van verzamelde persoonlijke gegevens via analyses of machine learning kan enorme waarde creëren en fungeren als een concurrentiedifferentiator voor organisaties, data-anonimisering, mits goed uitgevoerd, is geen eenvoudige taak. Zelfs met de identificatie van gevoelige informatie en het verwijderen van identificerende attributen zoals burgerservicenummers of adressen, is een dataset nog steeds niet anoniem. Zo kan een record zonder identificatiegegevens nog steeds met behulp van externe kennis opnieuw worden gekoppeld aan een individu. De combinatie van postcode, leeftijd en geslacht is uniek voor een groot aantal mensen. Dus, hoe kunnen organisaties ervoor zorgen dat persoonlijke gegevens kunnen worden gebruikt zonder de privacy van individuen in gevaar te brengen?

Laten we eerst een aantal technische aspecten van gegevensanonimisering definiëren. De term “anonimiseringsmethode” verwijst naar technische maatregelen die persoonsgegevens zodanig wijzigen dat bepaalde privacygaranties kunnen worden bewaard:

  • K-Anonimiteit zorgt ervoor dat elke persoon niet te onderscheiden is van “k” anderen met betrekking tot de attributen. Dat betekent dat een persoon niet langer kan worden geïdentificeerd zoals beschreven.
  • Differentiële privacy is op zijn beurt bekend uit statistische databases en gebruikt vaak willekeurige getallen om individuele informatie te verbergen.

Anonimisering in een Enterprise Stack

Laten we nu eens nader bekijken hoe deze technische maatregelen worden toegepast in een enterprise-stack. In de meeste gevallen is de IT-stack van de organisatie onderverdeeld in drie vlakken – infrastructuurvlak, datavlak en toepassingsvlak – op locatie of in de cloud, of op beide via een hybride architectuur.

Toepassingen verzamelen doorgaans persoonlijke gegevens en slaan deze op in het Gegevensbeheer laag voor verdere verwerking. De Data Management-laag kan vervolgens de gegevens uitwisselen tussen verschillende applicaties. Omdat de beschikbare technologie onafhankelijk is van de applicaties en elke applicatie de data kan gebruiken, is dit de ideale plek om anonimisering toe te passen. Het belangrijkste gebruiksscenario voor anonimisering is het creëren van datasets die kunnen worden geanalyseerd zonder individuele personen te identificeren. Het tweede gebruiksscenario is om vertrouwelijke bedrijfsgegevens te beschermen als een bedrijf informatie toevoegt aan een gegevensset, maar niet wil dat iemand de ware gegevens kent. In dit geval is het bedrijf zelf het individu en moet het worden beschermd.

Gebruiksscenario’s voor anonimisering

Een actueel voorbeeld hiervan zijn de hedendaagse ziekenhuizen, die gegevens willen gebruiken om COVID-19 te bestrijden door gebruik te maken van inzichten van eerdere patiënten, maar die worden aangevochten omdat patiëntgegevens zeer gevoelig en vertrouwelijk zijn en speciale bescherming vereisen volgens de wetgeving inzake gegevensprivacy. Door middel van anonimisering kunnen gegevens over COVID-19-patiënten worden gebruikt om nuttige inzichten te bieden aan clinici die informatie zoeken om een ​​nieuw gediagnosticeerde patiënt te behandelen zonder de privacy van eerdere patiënten in gevaar te brengen.

Een ander alledaags voorbeeld betreft het optimaliseren van boekingen en uitgaven voor zakenreizen. Door middel van anonimisering van gegevens kan een reisagent werken met veilige en vertrouwelijke datasets om boekingsprocessen te optimaliseren en de bijbehorende kosten te verlagen, terwijl hij reageert op verzoeken van reizigers en een hoge klanttevredenheid biedt.

Persona’s en het anonimiseringsproces

Dus hoe werkt dit precies? De eerste stap is zorgen voor een goede data-integratie in de Data Management-laag. Wanneer het om persoonsgegevens gaat, is het gebruik van ‘persona’s’ vereist, zoals:

1. De gegevensconsument wie toegang nodig heeft tot de gegevens
2. De gegevensbeheerder die toezicht houdt op het beheer en de beveiliging van alle persoonsgegevens
3. De functionaris voor gegevensbescherming en privacy wie er verantwoordelijk voor is dat de organisatie persoonsgegevens behandelt in overeenstemming met privacywetten en richtlijnen

Elk van deze persona’s heeft een unieke rol. De gegevensbeheerder is bijvoorbeeld verantwoordelijk voor het definiëren van de anonimiseringsparameters en vraagt ​​de goedkeuring van de functionaris voor gegevensbescherming en privacy, die ook de gegevensconsument goedkeurt. De gegevensbeheerder maakt vervolgens een entiteit aan en verleent de gegevensconsument toegang tot een privacyweergave, die een andere weergave is van de oorspronkelijke gegevensset. Daarnaast de Functionaris Gegevensbescherming en Privacy kan informatie opvragen op de privacyweergave om de toegepaste anonimiseringsmethoden te controleren. Uiteindelijk heeft de gegevensconsument alleen toegangsrechten tot de geanonimiseerde weergave van de originele gegevens.

Samenvatting

Afbeeldingsbron: SAP
Figuur 1: Persona’s die omgaan met persoonlijke gegevens.

Bedrijven moeten twee belangrijke punten in gedachten houden om een ​​succesvolle strategie voor gegevensanonimisering te garanderen. Ten eerste zijn eenvoudige maatregelen, zoals het verwijderen van ID’s, niet voldoende om een ​​dataset te anonimiseren. Ten tweede maakt anonimisering het gebruik van niet-identificeerbare persoonlijke en gevoelige gegevens mogelijk voor het uitvoeren van analyses en machine learning, waarvoor in het verleden de toestemming van een persoon nodig was. Aangezien de bezorgdheid over het gebruik van persoonlijke gegevens op wereldschaal blijft toenemen, zullen landen en overheidsinstanties de toegang tot en verwerking van persoonlijke, gevoelige gegevens verder beperken. Door de juiste data-anonimiseringstechnieken en -technologie te implementeren, kan een gemeenschappelijke middenweg worden gevonden waardoor bedrijven consumenten beter van dienst kunnen zijn met persoonlijke gegevens zonder hun identiteit in gevaar te brengen. Lees meer over dit onderwerp hier.

follow:
admin

admin

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige