Gegevensbeheer versus gegevenswetenschap

Gegevensbeheer versus gegevenswetenschap

De verschuiving in de zakelijke perceptie van data heeft Data Management nu naar nieuwe hoogten gekatapulteerd. Data Science is nu een kernonderdeel van Data Management, maar Data Management en Data Science worden vaak gezien als twee verschillende activiteiten. Datawetenschappers werken samen met data-analisten, data-engineers en DBA’s en besteden hun tijd aan het verkrijgen van de juiste data-infrastructuur voor data-analyse en competitieve intelligentie. Maar in de groeiende datamarkt van de volgende generatie zullen datamanagement en -analyse de belangrijkste differentiators zijn voor marktsucces, en dus moeten zowel datamanagement als datawetenschap samenwerken.

EEN Forbes bericht verwijst naar een onderzoek van de Everest Group dat stelt dat de wereldwijde datamanagement- en analysemarkt tegen 2025 135 miljard dollar zal bereiken. In de loop der jaren zijn leveranciers in deze markt van een functie-naar-proces- naar platformgerichtheid overgegaan. Bij platformgerichtheid worden data niet langer gezien als een bijproduct van bedrijfsprocessen, maar eerder als het zenuwcentrum van het bedrijf.

Gegevensbeheer versus gegevenswetenschap: het fundamentele verschil

De Gegevensbeheer De functie van een organisatie heeft de algehele controle over de acquisitie, opslag, kwaliteit, governance en integriteit van de bedrijfsgegevens – en houdt dus toezicht op de ontwikkeling en implementatie van alle gegevensgerelateerde beleidsregels binnen die organisatie. Het Data Management-team beheert echter alleen de gegevensactiva; het bemoeit zich meestal niet met de technische kerntoepassingen van de gegevens. De functie Gegevensbeheer is eigenaar van alle gegevens. In het webinar Gegevensbeheer versus gegevensstrategie, Peter Aiken, sprak over “prioriteit geven aan de behoeften aan gegevensbeheer van de organisatie versus de behoeften aan gegevensstrategie.”

Aan de andere kant is de Data Science functie in een organisatie bedenkt, ontwikkelt, implementeert en praktiseert alle “technische toepassingen” van de gegevensactiva. In die zin impliceren de “technische toepassingen” de wetenschap, technologie, ambacht en zakelijke praktijken waarbij de bedrijfsgegevens betrokken zijn.

Lees ook:  Opkomende cloud computing-technologieën - DATAVERSITY

Het Data Science-team is nooit eigenaar van gegevens; ze verzamelen, bewaren, verwerken en analyseren de gegevens eenvoudig rapporteer vervolgens datagestuurde resultaten aan de rest van de organisatie voor bedrijfswinst. De datawetenschapper wordt beschouwd als een expert op het gebied van datawetenschap en aanverwante technologieën, die vertrouwt op zeer gespecialiseerde kennis (kennis van statistiek, informatica, AI enzovoort) om de onderneming te adviseren over datagedreven praktijken.

In de praktijk valt de Data Science-functie onder de Datamanagementfunctie in de organisatie. Het Data Science-team brengt een reeks technische kernvaardigheden naar de organisatie om best practices te implementeren, zoals opgesteld door beleid, procedures en richtlijnen voor gegevensbeheer.

Data Management Practices vs. Data Science Practices

Met data die exponentieel toenemen in volume en complexiteit, is datamanagement een van de belangrijkste aspecten van het functioneren van een bedrijf geworden. Gegevensbeheerpraktijken het opzetten van gegevensgerelateerd beleid, procedures, rollen, verantwoordelijkheden en strikte mechanismen voor toegangscontrole omvatten.

Een goed gestructureerd Strategie voor gegevensbeheer, dat zich richt op Data Governance voor het maximaliseren van de bedrijfswaarde, is nu een centraal gespreksonderwerp tussen bedrijfsleiders en operators. Het datamanagementteam in een onderneming bedenkt en ontwikkelt al het beleid.

De dataprofessionals in de verschillende delen van een organisatie zijn verantwoordelijk voor het implementeren en volgen van alle beleidsregels en richtlijnen in hun dagelijkse datagerelateerde werk. Data Governance is geïdentificeerd als een kerncomponent van Data Management, zoals uitgelegd in Gegevensbeheer versus gegevensbeheer: verbetering van de gegevensstrategie van de organisatie.

In de Data Science-wereld is het strategisch beleid, procedures en richtlijnen spelen een belangrijke rol bij de implementatie van de datatechnologieprojecten, hoewel geen van de managementrollen in dit stadium direct aanwezig is. Met andere woorden, de gegevensstrategen van de organisatie sluiten hun werk af door het beleid, de procedures en richtlijnen voor het beheren van gegevens vorm te geven; dan is het de plicht van de datawetenschappers of andere dataprofessionals om zich te houden aan het beleid en de richtlijnen om ervoor te zorgen dat de blauwdruk van de organisatiegegevensstrategie intact is.

Lees ook:  Doel, bereik en doelstellingen definiëren in een gegevensbeheerbeleid

Datamanagementstrategen zullen ook nadenken over mogelijke overtredingen en straffen om toezicht te houden op de implementatie van de datastrategie van de onderneming door middel van controles.

Wat de datawetenschapper moet weten over datamanagement

Op weg naar Data Science stelt dat verschillende recente technologiebewegingen datawetenschappers hebben geëist om de praktijken van databeheer voor geavanceerde analyses te heroverwegen. Deze technologiebewegingen zijn:

  • Lagere kosten en toenemende capaciteit van gegevensopslag
  • Opkomst van IoT-apparaten met streaminggegevens
  • De heruitvinding van datameren om multi-type data op te slaan en te analyseren
  • Big data-analyse
  • Gebruik van machine learning-modellen

Met het bovenstaande centraal in moderne bedrijven, de data scientist staat nu voor de uitdaging om de juiste governance-gebaseerde data-infrastructuur te bouwen om geavanceerde analyses uit te voeren en inzichten met toegevoegde waarde te verkrijgen.

Augmented Data Management: de datawetenschapper ontlasten

In een typisch augmented Data Management-systeem, vijf Data Science-kernactiviteiten, namelijk data-integratie, Data Quality, Master Data Management (MDM), Metadatabeheer, en Database Management Systemen (DBMS), zijn volledig of gedeeltelijk geautomatiseerd door middel van tools.

De datawetenschapper wordt verlost van de “saaie datavoorbereiding” door het gebruik van geavanceerde AI-, Ml- of analysetools. Doorgaans wordt ongeveer 80 procent van de tijd van een datawetenschapper besteed aan het voorbereiden van data voor analyse; deze tools nemen dat tijdrovende engagement weg laat voldoende tijd over voor complexe analysewerkzaamheden, waaronder mogelijk modelontwikkeling of gegevensinterpretatie. Augmented Data Management gekenmerkt als een van Gartner’s Top 10 Data Analytics Trends voor 2020.

De rol van dataregelgeving in datamanagement en datawetenschap

De opkomst van gegevensregelgeving zoals de Algemene Verordening Gegevensbescherming (AVG) en CCPA heeft een nieuwe dimensie toegevoegd aan bestaande datamanagementpraktijken die Data Science overlappen. De nieuwe regelgeving biedt betere bestuursmechanismen, vooral op het gebied van gegevensprivacy, gegevensbeveiliging en ethiek, maar compliceert het door AI aangedreven Data Science-platform. Nu de datamanagers moeten niet alleen nadenken over het implementeren van strikte controles voor gegevensprivacy, beveiliging en ethiek, maar ze moeten zich ook zorgen maken over de impact van geavanceerde technologieën (AI, ML) op gegevensbeheer.

Lees ook:  RWDG-dia's: Rollen en verantwoordelijkheden voor gegevensbeheer

In de nieuwe wereld van op regelgeving gerichte praktijken op het gebied van datagovernance, datamanagement en datawetenschap, zullen dit parallelle activiteiten blijven, maar op verschillende momenten elkaar kruisen.

Het netto resultaat van een dergelijke botsing? Verkopers en serviceproviders zullen fuseren, verwerven en integreren.

Vanuit strikt technisch oogpunt, Gartner heeft de volgende waarneembare verschuivingen in de praktijk van enterprise datamanagement en data science vastgelegd:

  • Leren door te doen
  • Bedrijfsinformatie-architectuur
  • Denken aan een datahub voor verbeterde data governance
  • Centraliseren of decentraliseren en de nieuwe CDO-rol, of het nu Chief Data of Chief Digital is

Hoe sluiten datamanagement en datawetenschap op elkaar aan?

In een ideaal bedrijfsscenario worden datamanagement- en datawetenschappraktijken op elkaar afgestemd om de beste resultaten te behalen. Dus, hoe kunnen de twee praktijken op één lijn liggen?

  • Door middel van onderlinge afspraken over behoud van Data Governance richtlijnen
  • Door een beter begrip van hoe en waar Data Management en Data Science elkaar overlappen
  • Door een goed gestructureerd Data Science-framework te hebben, zodat junior datawetenschappers de klus kunnen klaren

Volgens een discussie op QuoraData Management richt zich op goed beheerde datacollectie en datatoegang. Data Science richt zich op het afleiden van strategische zakelijke beslissingen uit data-analyse. Het ontbreken van gegevensbeheer duidt op het risico dat “datawetenschap slechte analyses levert vanwege slechte kwaliteit of ontoegankelijke gegevens.”

Afbeelding gebruikt onder licentie van Shutterstock.com

Meer informatie over ?

Gegevensbeheer versus gegevenswetenschap
Of weten wat het voor jouw organisatie kan betekenen?

Onze business consultants komen het graag op locatie uitleggen.

Meer kennis uit deze categorie

Gegevensbeheer versus gegevenswetenschap

Gratis scan aanvragen
voor jouw organisatie?

    test

    Gratis scan aanvragen
    voor jouw organisatie?