Metadatabeheer impliceert een reeks activiteiten die gegevens beheren voor een beter gebruik en betere resultaten. Deze praktijk omvat dus het vaststellen van strikte rollen, verantwoordelijkheden, beleid en processen om ervoor te zorgen dat gegevensgestuurde informatie beschikbaar, toegankelijk, deelbaar en onderhoudbaar is binnen een organisatie voor de beste analyse en toepassing van dergelijke informatie in de dagelijkse praktijk. Op die manier, Metadatabeheer werkt samen met Data Governance – een goed geplande, systematische oefening om de juiste controles uit te voeren voor het beheren en beheren van bedrijfsgegevens.
Volgens Forrester Research, metadata beschrijft bedrijfsgegevens of biedt een context voor bedrijfsgegevens en de bijbehorende processen, services, regels en beleid. Daarom kunnen metadata van verschillende typen zijn: technische metadata, zakelijke metadata of operationele metadata, die elk verschillende functies bieden. Het artikel met de titel Metadatabeheer versus masterdatabeheer: een overzicht vermeldt dat metadata onderzoeksanalyses uitvoert (wat, waarom, waar, hoe en wanneer) op data. In die zin helpt het de zakelijke gebruikers om de gegevens die ze gebruiken te begrijpen.
In de Gartner-rapport Marktgids voor oplossingen voor metadatabeheeris het oordeel van eigenaren van grote bedrijven duidelijk; de bedrijven willen Metadata Management (MM) om al lang bestaande problemen op het gebied van Data Governance, MDM, BI en Enterprise Metadata Management aan te pakken. In duidelijke bewoordingen zijn dit de top vijf MM-kanshebbers op de verlanglijstjes van zakelijke gebruikers:
- Gedecentraliseerd gegevensbeheer en selfservicetools met behoud van veiligheid en privacy
- Strengere metagegevensvereisten voor IoT-gegevens
- Meer contextuele metadata voor online informatie
- Toepasbaarheid van metadata op voorspellende analyse
- Ontgrendelen van gegevenssilo’s met metagegevenshulpmiddelen
Binnen de context van dit artikelonderwerp zijn alle bovenstaande zakelijke vereisten relevant, aangezien Business Analytics niet kan plaatsvinden zonder een van deze vereisten in overweging te nemen. Het artikel Grondbeginselen van metadatabeheer legt de kerncomponenten van metadata uit. Het artikel concentreert zich op drie brede voordelen van metadatabeheer voor bedrijven van elk formaat, voor zover deze betrekking hebben op enterprise BI. Om enterprise BI of analytics beter te laten presteren dan de concurrentie en kansen te creëren, moeten gegevensdefinities consistent zijn, moeten de onderlinge relaties tussen gegevens duidelijk zijn, en data lineage moet duidelijk worden getraceerd. Metadatabeheer kan alle drie leveren.
Business Analytics met een datawarehouse
In een typisch datawarehouse is de repository voor het verzamelen van metadata een integraal onderdeel. Het datawarehouse wordt gedefinieerd in termen van “gegevensdefinities, schema, weergaven, hiërarchieën, locaties en inhoud”. Deze direct beschikbare informatie wordt erg nuttig tijdens bedrijfsanalyses en neemt veel overmatige arbeid weg die gepaard gaat met gegevensverkenning.
Big data-analyse en metadatabeheer
Het hierboven genoemde voordeel is dieper waarneembaar wanneer de analyses worden uitgevoerd met big data, wat voor 80 procent uit ongestructureerde data bestaat. Als de datamanagementstructuur in zo’n complex scenario niet goed wordt afgehandeld, kan een bedrijf uiteindelijk een aanzienlijk marktaandeel verliezen met foutieve analyses. Metadatabeheer is dus essentieel voor BI of analyse met big data. Hoe beter de “gegevenscategorisering en organisatie”, hoe sneller de beslissingen. Het artikel Vijf redenen waarom big data metadatabeheer nodig hebben en hoe u dit kunt gebruiken biedt vijf goede redenen waarom metadata cruciaal zijn voor het succes van big data-analyse.
Wanneer gegevens over een onderneming worden verspreid in verschillende gegevensbronnen, zoals datawarehouses, datamerenof silo’s, niets werkt zo metadata om snel zoeken en toegang tot vereiste gegevens te vergemakkelijken. Het artikel Datameren en big data-analyse: het wat, waarom en hoe van datameren biedt een overtuigende primeur waarom een datameer dient als een deeloplossing voor het opslaan van multigestructureerde data, maar de oplossing is nog niet compleet zonder Metadata Management.
Data Science Central legt uit waarom Metadatabeheer inherent is aan het succes van big data-analyse. De aanwezigheid van metadata in enorme hoeveelheden semi-gestructureerde of ongestructureerde data kan het voor een gebruiker gemakkelijk maken om snel door irrelevante informatie te bladeren en precies te vinden wat nodig is. Deze opgelegde structuur was altijd aanwezig in een datawarehouse of een datameer. Metadata Management kan ook helpen bij het toepassen van consistente bedrijfsregels op bedrijfsgegevens. Met andere woorden, metadata zorgen voor meer duidelijkheid, consistentie en transparantie voor kritieke bedrijfsinformatie. Sociale media vandaag zegt dat organisaties bij gebrek aan gekwalificeerde interne data-experts steeds vaker op zoek zijn naar managed services om big data-analyses uit te voeren.
Waarom zijn metagegevens belangrijk voor gegevensbeheer?
Data Governance bepaalt wie toegang heeft tot data en hoe, stelt standaarden vast voor data-eigendom en -controle, en legt rollen en verantwoordelijkheden op voor Data Stewardship. Datamanagement wordt een volledig “controleerbare en verantwoordelijke” oefening. Aangezien metadata verschillende beschrijvingen, definities en tags biedt om data te classificeren, categoriseren en ordenen, is het duidelijk dat Metadata Management en Data Governance hand in hand zullen werken om de juiste controles op bedrijfsdata te implementeren. In dit verband het artikel Gegevensbeheer versus gegevensbeheer: verbetering van de gegevensstrategie van de organisatie verduidelijkt het onderscheid tussen Data Management en Data Governance. Zonder metadatabeheer kunnen ondernemingen geen “tijdige” en “betrouwbare” informatie leveren. Metadatabeheer gaat, net als gegevensbeheer, zowel over mensen, beleid en processen als over de ‘gegevens’.
De Blog over datavirtualisatie pleit sterk voor de noodzaak van Metadata Management in tools voor datavirtualisatie. De auteur van dit bericht is van mening dat voor de toepassing van gegevensvirtualisatie een end-to-end-oplossing vereist is, van de gegevensverzameling tot de gegevenspublicatiefasen.
Bovendien, een recente webinar helpt om gegevenswoordenboeken en gegevenscatalogi te begrijpen, en hoe metagegevens deze gegevensarchieven vullen. Het webinar bespreekt ook hoe Data Governance wordt toegepast op metadata.
Metadatabeheer in BI
Hier zijn enkele solide redenen waarom Metadata Management nodig is voor BI- of bedrijfsanalyseactiviteiten:
- Voor het zoeken naar zeer specifieke informatie uit bergen gegevens. Traditioneel duurden ETL-processen voor drilled search veel tijd, die dankzij Metadata Management met minstens 50 procent is verminderd.
- Metadatabeheer maakt het mogelijk om datasets op te splitsen en in stukjes te snijden, wat helpt bij het vaststellen van correlaties en verborgen patronen in gegevens. Gecentraliseerd beheer van metadata is nog beter omdat het snel zin geeft aan veel ongelijksoortige data uit verschillende bronnen.
- Metadatabeheer verkort de analysetijd door efficiënte datamanagementfuncties te bieden en creëert meer waarde voor BI-activiteiten.
- Metadatabeheer verbetert de uitlijning van gegevens tussen gegevenssilo’s en helpt bij het creëren van een uniforme taal om gegevens te interpreteren.
- Metadatabeheer helpt individuele afdelingen om te voldoen aan plotselinge wijzigingen in rapportagevereisten, bijvoorbeeld van maandelijks naar dagelijks.
Slotnota
Het tempo van de datagroei heeft metadatabeheer in ondernemingen noodzakelijk gemaakt. In het big data-tijdperk data voorbereiding voor analytics en BI is nu eerder een bron van kansen dan een belemmering. Hier komen Data Science en aanverwante technologieën om de hoek kijken. Zolang big data-analyse van cruciaal belang is voor bedrijven, blijft Metadatabeheer ook een andere kritieke activiteit.
Afbeelding gebruikt onder licentie van Shutterstock.com