ad_dgvvoreh_082520.jpg

Gegevensbeheer: balans tussen veiligheid en beschikbaarheid

Toen Maria Voreh bij het Federal Bureau of Investigation (FBI) begon, was haar eerste opdracht het werken aan het Integrated Automated Fingerprint System (IAFS), een technologie die vaak te zien is in politiefilms en televisieshows zoals ‘CSI’. “Ze maken een afdruk en de machine doet dit magische werk, en een paar seconden later wordt de verdachte gevonden.” Voreh is Chief Data Officer (CDO) bij de FBI en was keynote speaker bij DATAVERSITY® DG Vision-conferentie. Haar presentatie zoals getiteld Gegevensbeheer in de moderne tijd: gegevensbeveiliging in balans brengen met gegevensbeschikbaarheid.

De gegevens die IAFS doorzoekt, zijn niet die van de FBI – de gegevens zijn afkomstig van alle wetshandhavingsgemeenschappen in het land. Om het te beschermen, zijn er regels, beperkingen en beleid van kracht over hoe het kan worden gebruikt of gedeeld. Dat is hoe Voreh echt begon te werken bij de FBI, zei ze: werken aan regels om de integriteit en veiligheid van persoonlijke gegevens te behouden, en tegelijkertijd beschikbaar stellen in minder dan een seconde voor de wetshandhavingsambtenaar.

‘Als je een wetshandhavingsambtenaar aan de kant van de weg hebt staan, heeft hij geen vijf minuten om op antwoord te wachten. Hij heeft letterlijk seconden of subseconden om te weten of de persoon in deze auto gewoon moeder is die op weg is naar voetbal en dat ze te laat is, of de man die wordt gezocht voor een massamoord ergens verderop. “

Hoewel dataveiligheid en beschikbaarheid is Voreh’s leven de afgelopen 20 jaar bij de FBI geweest, ze denkt niet aan haar focus in termen van de gegevens, maar eerder over het aanbieden van een dienst aan gebruikers, terwijl ze de belangen beschermt van degenen die bereid zijn hun gegevens.

Enorme datacyclusuitdagingen

“We worden overspoeld met gegevens.” Grubhub heeft elke minuut meer dan 8.000 verzoeken om eten, terwijl 18 miljoen sms’jes worden verzonden en 45 miljoen Google-zoekopdrachten worden uitgevoerd in dezelfde hoeveelheid tijd, zei ze. “We hebben letterlijk zoveel gegevens in ons leven”, en diezelfde hoeveelheid gegevens stroomt ook de overheid in en uit.

Technologie levert meer gegevens en de mogelijkheid om meer te weten dan ooit tevoren, maar om er betekenis aan te geven, zijn extra lagen technologie en gegevens nodig. “Dit wordt een zelflikkend ijshoorntje. We veroorzaken letterlijk een exponentiële groei van onze eigen data, maar we kunnen het niet stoppen – en we moeten het ook niet stoppen. ”

Juridische, ethische en morele uitdagingen

De Privacywet voor persoonlijke informatie kwam uit in 1974, net als de Federale wet inzake onderwijsrechten en privacy (FERPA), die persoonlijke gegevens (naam, adres, geboortedatum, burgerservicenummer) in onderwijsinstellingen beschermde. Later, halverwege de jaren negentig, werd aanvullende wetgeving aangenomen om financiële gegevens te beschermen en mocht de Federal Trade Commission (FTC) het gebruik van financiële gegevens gaan controleren. Recente wetgeving zoals de Algemene verordening gegevensbescherming (AVG) en de California Consumer Privacy Act (CCPA), gaat verder dan het beschermen van een specifiek soort gegevens, maar ook het beschermen van de rechten van de consument of ingezetene om te bepalen wat bedrijven doen met persoonlijke gegevens.

Diezelfde verandering in focus is ook voelbaar bij de overheid, waar het niet langer alleen een proces is om bepaalde datavelden op een gereguleerde manier te beschermen. Nu strekt de verantwoordelijkheid zich uit tot het beschermen van die informatie tegen misbruik, tegen gecompromitteerd raken en tegen misbruik van de rechten om die gegevens te gebruiken.

Voreh zei dat gegevensbeoefenaars serieus moeten overwegen:

  • Wat is de impact op de persoon en op de mensheid als ik die gegevens gebruik?
  • Schep ik een precedent?
  • Heiligen de doelen de middelen?
  • Doe ik meer goed dan kwaad?

Eén misstap, en het vertrouwen van de klant is verloren. “Als ik in mijn bedrijf het vertrouwen van het publiek verlies, wordt mijn baan onmogelijk.”

De realiteit van vertrouwen

Voreh deelde de volgende statistieken uit een artikel met de titel J. Clement Online privacy – Statistieken en feiten:

  • 22 procent van de online gebruikers gaf aan dat het online opslaan van gevoelige gegevens niet veilig genoeg was
    • 40 procent van de online gebruikers geeft aan bezorgd te zijn over misbruik van hun online gegevens
    • 53 procent van de online gebruikers maakt zich meer zorgen over hun privacy dan een jaar eerder
    • 24 procent van de wereldwijde online gebruikers vertrouwt hun overheid het beheer en de bescherming van hun persoonlijke gegevens toe
    • 66 procent van de online gebruikers gaf aan zich vanwege de eigen overheid in toenemende mate zorgen te maken over hun online privacy

Voreh zei dat het laatste cijfer haar bang maakt: 66 procent is bezorgd dat ze hun gegevens gaat misbruiken. ‘Als ik dat zie, maak ik me zorgen. Wat moet ik doen om ze het vertrouwen te geven dat ik voor hun gegevens ga zorgen? ” Professionals in de particuliere sector en de academische wereld delen dezelfde bezorgdheid, omdat misbruik van vertrouwen leidt tot verloren klanten, gederfde inkomsten of minder studenten.

Opkomende technologische uitdagingen

Opkomende technologie heeft ongekende mogelijkheden geboden om gegevens te analyseren, gegevens te exploiteren en deze te gebruiken om echt een verschil te maken. Toen de FBI in 2001 aan de Enron-zaak werkte, werkten ze met een paar gigabytes aan gegevens en hadden ze 100 agenten eraan toegewijd.

Bij de bomaanslag op de Boston Marathon in 2013 werkten ze met terabytes aan gegevens. “We begonnen veel tv met ondertiteling te ontvangen, enkele video’s van telefoons, en we gooiden er wat technologie en veel agenten in.”

Tegen de tijd dat de opnames in Las Vegas in 2017 plaatsvonden, hadden ze 22.000 uur aan gesloten tv-circuit, evenals persoonlijke video’s en overschreden ze een petabyte aan gegevens. “We hadden tools en we probeerden wat computer vision-technologie te gebruiken om afbeeldingen en mensen te detecteren, maar nogmaals, de technologie was er, maar we maakten ons zorgen over het gebruik ervan vanwege de onbedoelde resultaten.”

Panda of Gibbon?

De uitdaging van technologieën zoals kunstmatige intelligentie (AI), machine learning en neurale netwerken kunnen ons op de vooravond van grootsheid zetten, maar ze zijn nog niet helemaal bewezen. “We kunnen ze niet uitleggen aan onze gebruikers, en daardoor komen we in onbedoelde uitkomsten”, wat deze technologieën kwetsbaar maakt voor misbruik.

Voreh had het over een experiment een neuraal netwerk gebruiken om een ​​foto van een panda te identificeren. Onderzoekers veranderden 0,04 procent van de pixels in het beeld, waardoor het neurale netwerk zijn classificatie veranderde van “Panda, met 57,7 procent vertrouwen” in “Gibbon, met 99,3 procent vertrouwen”. Voor het menselijk oog is de verandering niet waarneembaar. De foto lijkt op een panda, maar de computer is het daar niet mee eens. ‘Dus we kunnen de mens niet in de lus verwijderen. Wij mensen moeten nog steeds deel uitmaken van onze technologie, deze trainen en bijscholen. ”

Kwaliteitsgegevens en goede datamanagementpraktijken zijn nodig om algoritmen te trainen en bij te scholen, omdat nieuwe technologie die is getraind op basis van slechte data slechte resultaten oplevert. “Daar beginnen we het vertrouwen van het publiek te verliezen”, zei ze.

Nieuwe technologie vereist ook getrainde mensen die de waarde van de gegevens begrijpen, hoe ze er op de juiste manier mee om moeten gaan en hoe ze metagegevens kunnen annoteren om de bron, het doel en het toegestane gebruik van de gegevens te documenteren. “Zonder dat is deze nieuwe technologie gewoon leuk en leuk. Het doet niets voor onze werkelijke missiedoeleinden. “

Gegevensbeveiliging versus gegevensbeschikbaarheid

De verantwoordelijkheid voor gegevensbeveiliging zou niet langer uitsluitend de verantwoordelijkheid van IT moeten zijn, zei ze. Bescherming, toegangscontrole, privacy, vertrouwelijkheid, naleving en risicovermindering moeten worden gedeeld. Beleid en tools kunnen dit vergemakkelijken, maar uiteindelijk moeten gebruikers de verantwoordelijkheid voor gegevens delen.

Aan de andere kant zei Voreh dat gegevensbeoefenaars en mensen in de IT vaak deze eisen van gebruikers horen:

  • Ik heb meer en betere gegevens nodig om betere analyses te kunnen doen
    • Ik moet die visualisatie nu kunnen maken
    • Ik heb de gegevens nodig in een formaat dat ik kan gebruiken. Laat me niet de datum en tijd omrekenen of uitzoeken welk veld de achternaam is
    • Ik moet toegankelijk zijn op mijn homecomputer, als ik niet aan het werk ben, in het vliegtuig
    • Ik heb normen nodig, zodat ik dat allemaal meteen kan doen

‘Het is een balans. Ik kan het een niet hebben zonder het ander. Ik kan me niet zozeer concentreren op de kenmerken van gegevensbeveiliging, dat ik de beschikbaarheid negeer, ”zei ze.

De oplossing: gegevensbeheer en gegevensbeheer

Zei Voreh Gegevensbeheer en Gegevensbeheer zijn de sleutels tot het vinden van een evenwicht tussen veiligheid en toegankelijkheid. Governance en management bieden een manier om:

  • Begrijp welke gegevens moeten worden beheerd en wanneer
  • Zorg voor goede programma’s en praktijken die vangrails en grenzen bieden aan gebruikers
  • Zorg voor een bestuursproces dat een raamwerk voor gegevensbeheer toepast, waardoor open en inclusieve besluitvorming mogelijk is

Het eerste instinct is om gewoon een stel wetenschappers in dienst te nemen, maar als de kwaliteit van de gegevens er niet is en de gegevens niet voor hen beschikbaar zijn, is het gewenste resultaat waarschijnlijk een stel dure wetenschappers en geen inzicht, ze zei.

“Ik zou oplossingen kunnen kopen, maar zonder een idee van wat ik beheer en waarom, zet ik die kar gewoon voor het paard.”

Governance verbindt paard en wagen

Eerst liet Voreh een cartoon zien van een kar (data-oplossingen) die een paard trekt (Data Management), daarna keerde Voreh de twee om, waarbij het paard op de eerste plaats kwam met de schacht die paard en wagen met het label “Governance” verbindt. “Wat we echt moeten doen, is nadenken over wat de behoefte van onze organisatie aan datamanagement is”, in het licht van de bedrijfsdoelstellingen voor de komende vijf jaar.

Een plan dat is afgestemd op het bedrijf is essentieel, maar omdat elke organisatie uniek is, “kun je van niemand anders een datamanagementplan lenen.” Een datamanagementstrategie moet op maat worden gemaakt en de governance koppelt het aan uw oplossingen.

Voreh zei dat wanneer belanghebbenden worden betrokken bij de ontwikkeling van Governance, datamanagementpraktijken democratisch zijn en dat governance wordt geaccepteerd door de cultuur in de bredere organisatie. “Anders verzin je regels op een bureaucratische manier, en niemand zal ze opvolgen.”

Hoe u gegevensbeheer kunt vergroten

Voreh behaalde succes met het bestuur bij de FBI door zich te concentreren op de missie en visie van de organisatie, en stelde voor om drie vragen te overwegen tijdens het proces van het laten groeien van een Data Governance-programma:

  • Wat zijn wij als organisatie?
    • Waar is de visie die de directeur wil dat we over vijf jaar realiseren?

Vanaf daar is een Gegevensstrategie kan worden gebruikt om prioriteit te geven aan datamanagementpraktijken en om die te bevorderen die het meest aansluiten bij de missie. Begin met de meest kritieke gegevens in uw organisatie en pas kwaliteitsnormen toe, en pak vervolgens compliance en toezicht aan. “Een beleid opstellen zonder effectief toezicht en naleving is als het schrijven van een memo die niemand zal lezen.” Betrek bij het aannemen van dit beleid de zakenmensen en andere gebruikers van de gegevens.

Faciliteer met openheid

Voor wat gewoonlijk ‘issue management’ wordt genoemd, geeft Voreh er de voorkeur aan om de term ‘openheid’ te gebruiken om te verwijzen naar het proces van luisteren en het aanpakken van gebruikersproblemen. “Het is niet mijn taak om te dicteren, het is mijn taak om te faciliteren.” Het is belangrijk om problemen te kunnen accepteren zoals ze door de gebruiker zijn gedefinieerd en ze te begeleiden naar een oplossing die ze bezitten.

Vorig jaar combineerde de FBI verschillende teams om gezamenlijk kwesties rond mensen, processen, capaciteiten en gegevens aan te pakken: “Het was een enorm succes”, zei ze. De mensen aan de raad zijn onder meer datawetenschappers, analisten, datastewards, eerstelijnsgebruikers, juridische zaken, beleidsmensen, agenten en inlichtingenanalisten. Door problemen vanuit een 360-gradenbeeld te bespreken, kunnen beslissingen worden genomen met behulp van de capaciteit van de mensen die gegevens onderhouden, verzamelen, gebruiken en IT-diensten verlenen.

Vooruit gaan

Voreh zei dat het gemakkelijk is om het gevoel te hebben dat alle problemen in één keer moeten worden opgelost. “Dat kan niet, tenzij je veel geld en veel personeel hebt. Neem de babystapjes, werk aan je foundation en laat het groeien om je te helpen. ”

Wilt u meer weten over de aankomende evenementen van DATAVERSITY? Bekijk onze huidige line-up van online en persoonlijke conferenties hier.

Hier is de video van de presentatie van DG Vision:

Afbeelding gebruikt onder licentie van Shutterstock.com