Cloudgebaseerde datamanagementplatforms in het tijdperk van privacy

Klik voor meer informatie over auteur Keith D. Foote.

Momenteel gebruiken veel bedrijven openbare clouds om hun gegevensbeheer uit te voeren. Datamanagementplatforms (DMP’s) begonnen in de late jaren negentig en begin jaren 2000 populair te worden. In die tijd spraken de internetdiensten van Amazon en Salesforce een groot aantal bedrijven aan omdat het hun interne onderhoudskosten verlaagde en tegelijkertijd de extra flexibiliteit ondersteunde die nodig is voor een constant veranderende zakelijke omgeving.

Ook het gebruik van cloud-ondersteunde AI heeft het opslaan en verwerken van enorme hoeveelheden gegevens veel efficiënter gemaakt. Het is belangrijk om te erkennen dat platforms voor gegevensbeheer in hoge mate afhankelijk zijn van cookietechnologie bij het identificeren van klantgedrag. Steve Touw, CTO en medeoprichter van Immuta, zei dit over het gebruik van cloudgebaseerde datamanagementplatforms:

“De cloud stelt organisaties in staat om grote hoeveelheden informatie op te slaan en te verwerken tegen aanzienlijk lagere kosten dan in hun eigen datacenters, waardoor de bedrijfs- en IT-activiteiten worden getransformeerd. De cloudgestuurde teams van tegenwoordig zijn slanker, sneller, veiliger en productiever. Nu bedrijven steeds meer gegevens verzamelen, wenden ze zich nu tot de cloud, niet alleen voor gegevensopslag, maar ook voor nieuwe manieren om gegevens te verwerken, berekenen en analyseren. De dagen van het implementeren van on-premise big data-infrastructuur – wat jaren kan duren om te budgetteren, aan te schaffen, te bouwen en te optimaliseren – zijn geteld. Moderne data- en analyseplatforms in de cloud bieden datateams schaalbaarheid, flexibiliteit, kostenbesparingen en prestaties, waardoor organisaties meer met data kunnen doen om snellere beslissingen te nemen, data te delen en geld te verdienen en datagestuurde producten te bouwen. “

Er zijn echter zorgen over nieuwe regels voor gegevensprivacy, zoals die van Europa AVG (Algemene verordening gegevensbescherming) en de CCPA (California Consumer Privacy Act), en hun impact, groeit. Safari, Firefox en Google Chrome hebben bijvoorbeeld aangekondigd dat ze het gebruik van cookies van derden geleidelijk zullen stopzetten tegen het jaar 2022. Gegevens die uit cookies over individuen worden gehaald, worden vaak van overal op internet verzameld. Deze gegevens bouwen psychologische profielen op en kunnen worden gebruikt om online shoppers te verleiden iets te kopen dat ze willen. Helaas kunnen deze profielen ook worden gebruikt om mensen aan te vallen en te manipuleren door verkeerde informatie (of liegen) te promoten. Gelukkig hebben veel openbare clouds maatregelen genomen om privacy in evenwicht te brengen met het begrijpen van de consumentenbasis. Het is belangrijk om onderzoekswolken met oplossingen voor het vervangen van de gegevens die voorheen door cookies werden aangeleverd.

Gegevensbeheer in de cloud

In wezen creëert alles wat een klant doet op de website of mobiele app van een bedrijf, gegevens. Deze gegevens kunnen vervolgens worden gebruikt om marketingstrategieën te ontwikkelen en het klantenbestand te vergroten. Het kan heel nuttig zijn om de persoonlijke gegevens van een klant samen te voegen met de aankopen die ze hebben gedaan bij andere online organisaties. Dit soort gegevens geeft een beter begrip van individuele klanten en helpt om verschillende segmenten te begrijpen en hoe hun winkelgedrag varieert. Om dit te bereiken, wordt cloud ondersteund Gegevensbeheer platforms ondersteunen de volgende processen:

  • De verzamelde gegevens worden op één plek opgeslagen
  • Gegevens van derden helpen bij het ontdekken van nieuwe markten
  • Klantinzichten verkrijgen
  • Helpt marketingkosten effectief te budgetteren

Een gegevensbeheerplatform slaat digitale gegevens op, zoals klantgegevens (afkomstig van cookie-ID’s of mobiele ID’s) en marketingcampagnegegevens. Dit soort informatie kan marketeers en adverteerders helpen om gedragspatronen te vinden voor het klantenbestand als geheel en voor individuele klanten. Deze gedragspatronen omvatten demografische gegevens, eerder browsegedrag, de apparaten die klanten gebruiken en meer.

Steve Touw van Immuta ging verder met het bespreken van beveiligingsproblemen over DMP’s in de wolk, zeggende:

“Nu bedrijven steeds meer naar de cloud gaan, is het grootste probleem waarmee datamanagementteams worden geconfronteerd, hoe ze de toegang tot cloudgegevens kunnen automatiseren en schalen zonder de beveiliging en privacybescherming in gevaar te brengen. De zegen (en vloek) van de cloud is dat het alle data centraal opslaat, meestal in een cloud datameer of datawarehouse. Hoewel dit enorme kostenbesparingen oplevert, stelt het bedrijven mogelijk ook bloot aan materiële juridische risico’s en contractuele schendingen als gegevens worden gehackt, geschonden of in verkeerde handen terechtkomen. Simpel gezegd, de cloud maakt het veel moeilijker om bedrijfsbrede gegevenstoegang te beheren, vooral wanneer bedrijven meerdere cloudgegevens- en analyseplatforms gebruiken, zoals Snowflake, Databricks, Azure Synapse en andere. Immuta’s recente Data Engineering Survey onthulde dat de meerderheid van de bedrijven van plan is om binnen de komende twee jaar meerdere cloud computing-technologieën te implementeren. Hoewel deze platforms enorme macht bieden tegen lagere kosten, vereisen ze datateams nieuwe toegangscontrole- en beheeroplossingen gebruiken die beveiliging, juridische, compliance- en bedrijfsteams overbruggen om tijdige toegang tot kritieke bedrijfsgegevens te garanderen en tegelijkertijd de risico’s te verkleinen. “

De verschillende bronnen en soorten gegevens

Gegevens zijn afkomstig uit verschillende bronnen en zijn op verschillende manieren gecategoriseerd. Hoe gegevens worden gebruikt, hangt af van wat voor soort gegevens het zijn. Datamanagementplatforms halen hun gegevens over het algemeen uit drie soorten bronnen:

  • Eigen gegevens: Dit zijn gegevens die worden verzameld en eigendom zijn van de organisatie zelf. De organisatie kan bijvoorbeeld websitegegevens, toepassingsgegevens van mobiele telefoons en gegevens over klantrelatiebeheer verzamelen (Salesforce gebruikt deze gegevens om de interacties en relaties van een organisatie met hun klanten en potentiële klanten te beheren).
  • Gegevens van tweede partij: Deze gegevens zijn verzameld door een ander bedrijf en vervolgens verkocht. Het bevat zowel online campagnegegevens als klantreisgegevens.
  • Gegevens van derden (cookies): Gegevens die worden aangeleverd door gegevensverzamelaars – het zijn gegevens die zijn gekocht van bronnen die niet de oorspronkelijke verzamelaars zijn. Grote gegevensverzamelaars halen gegevens van verschillende andere platforms en websites. Deze aggregators kopen gegevens van uitgevers en andere gegevensbronnen.

Uit deze eerste, tweede en derde bronnen worden drie hoofdtypen gegevens verzameld en gedownload naar gegevensbeheerplatforms. Zij zijn:

  • Waargenomen gegevens: Over het algemeen is dit de digitale voetafdruk die internetgebruikers achterlaten, zoals een zoekgeschiedenis (bijvoorbeeld voor winterlaarzen) of het type webbrowser dat wordt gebruikt.
  • Afgeleide gegevens: Dit type gegevens is gebaseerd op conclusies die zijn getrokken uit het internetgedrag van een gebruiker, en in hoge mate is het giswerk (en kan het irritant zijn als de gok verkeerd is).
  • Aangegeven gegevens: Deze gegevens worden (oorspronkelijk) verstrekt door de gebruikers die online formulieren of applicaties invullen.

Gegevensbeheerplatforms en privacywetten

DMP’s hebben digitale marketeers geholpen nieuwe klanten te vinden met behulp van gegevens van derden. De AVG en CCPA maken het daarentegen moeilijker om gegevens van derden te verkrijgen. Voorheen verwerkten Data Management-programma’s gegevens van derden en bestaande wetten vereisten geen toestemming van de gebruiker bij het verzamelen van de gegevens. De AVG stelt echter dat persoonlijke gegevens – inclusief de gegevens die door cookies worden verzameld – alleen mogen worden gebruikt met toestemming van de gebruiker. Dit betekent dat het verzamelen van gegevens van derden moeilijker wordt voor bedrijven en zelfs illegaal kan worden. Als gevolg hiervan zullen DPM’s meer moeten vertrouwen op data uit de eerste en tweede partij.

Immuta heeft een alternatieve oplossing ontwikkeld voor de kwestie van privacywetten en het verlies van cookies door het gebruik van metadata en externe catalogi in combinatie met AI en machine learning om een ​​geïntegreerde en evenwichtige oplossing te bieden. Hun de-identificatie en controlefuncties vervangen handmatige processen, waardoor onderzoekers snel en efficiënt waardevolle gegevensanalyses kunnen leveren. Steve Touw merkte op:

“2020 was een belangrijk jaar voor Immuta, aangezien we aanzienlijke productinvesteringen hebben gedaan om ons geautomatiseerde Data Governance-platform naar de populairste clouddataplatforms te brengen. We hebben onlangs native ondersteuning aangekondigd voor Databricks, Snowflake en Starburst, die volgens ons onderzoek tot de meest gebruikte platforms behoren. Voor bedrijven met twee of meer van deze platforms biedt Immuta een enkele oplossing om platformonafhankelijke gegevenstoegangscontrole, -detectie en -classificatie en privacybescherming te automatiseren – de productiviteit aanzienlijk verbeteren, meer gegevens ontsluiten voor meer gegevensgebruikers en het risico van gegevens minimaliseren lekken of inbreuken. “

De toekomst van DMP’s

Naarmate bedrijven hun focus verleggen naar gegevens uit de eerste en tweede partij en directe relaties met consumenten, komt het nut van cookies van derden in twijfel. Gegevens van derden zijn gebaseerd op geaggregeerde en niet-geïdentificeerde rapporten. Als gevolg hiervan zullen datamanagementplatforms worden aangepast en aangepast om te werken met first-party, toegestane data en enigszins beperkte second-party data.

Deze nieuwe DMP’s zullen worden ontworpen voor het vastleggen, beheren en veilig matchen met toestemming persoonlijk identificeerbare informatie (of PII). De hoeveelheid gegevens van de eerste partij zal aanzienlijk toenemen en de mogelijkheid om persoonlijk identificeerbare informatie van de eerste partij en gegevens van de tweede partij veilig te matchen, zal aanzienlijk verbeteren. Met deze veranderingen zal de behoefte aan datatechnici toenemen. Steve Touw voorspelt:

“In 2021 verwachten we een versnelling in de verschuiving naar de cloud en de opkomst van ‘data als product’, met DataOps in opkomst als een nieuwe, cruciale functie en discipline voor clouddatabeheer, beschikbaarheid, kwaliteit, governance en beveiliging. Hoewel het aantal DataOps-professionals vandaag de dag in de duizenden telt, verwachten we een explosie op dit gebied – analoog aan wat zich heeft voorgedaan met DevOps voor de implementatie en het beheer van cloudapps. DataOps-teams zullen dezelfde agile principes toepassen bij het beheren van data als een cruciale asset voor organisaties, of het nu wordt gebruikt voor BI, Data Science of om datagestuurde producten en gebruikerservaringen mogelijk te maken. Naarmate DataOps opkomt, zullen we een aanzienlijke stijging zien in de vraag naar data-ingenieurs, data-architecten, eigenaren van dataplatforms en andere dataprofessionals – degenen die data kunnen beheren op meerdere clouddataplatforms terwijl de toegang tot gevoelige informatie wordt beschermd en gecontroleerd. “