Metadata beheren: een onderzoek naar succesvolle benaderingen

Metadata

“Als Google binnen enkele seconden resultaten kan leveren op het hele internet, waarom heb ik dan zo veel moeite om dingen in mijn organisatie te vinden?” vroeg Jonathan Adams, Research Director bij Infogix, op de DATAVERSITY® DGVision-conferentie. In een presentatie met de titel “I Never Metadata die ik niet leuk vond”Adams schetste succesvolle benaderingen voor het begrijpen en beheren van metadata

Wat is metadata?

Volgens het DAMA International Data Management Body of Knowledge (DAMA-DMBoK2), is de algemene definitie voor metadata, ‘data over data’, te simpel. Vergelijkbaar met het concept van de kaartencatalogus in een bibliotheek, metadata bevat informatie over technische en bedrijfsprocessen, gegevensregels en -beperkingen en logische en fysieke gegevensstructuren. Het beschrijft de gegevens zelf, de concepten die de gegevens vertegenwoordigen en de relaties tussen de gegevens en concepten. Begrijpen metadata’s doel, stel je een grote bibliotheek voor, met honderdduizenden boeken en tijdschriften, maar zonder kaartcatalogus. Zonder de kaartcatalogus zou het vinden van een specifiek boek in de bibliotheek moeilijk, zo niet onmogelijk zijn. Een organisatie zonder metadata is als een bibliotheek zonder kaartcatalogus.

“Het zijn duidelijk gegevens over gegevens, in die zin. Dat weten we allemaal, maar ook: de gegevens van een persoon zijn de metagegevens van een ander. Dus het wordt een beetje verwarrend, ‘zei Adams. Metadata heeft traditioneel gericht op technische metadata, die de structuur van gegevens en waar deze zich bevinden gedetailleerd beschrijven, IT ondersteunen bij het beheren van gegevens en gebruikersgemeenschappen helpen bij het openen en integreren van gegevens. Referentie data, dat een bekend vocabulaire biedt en een zakelijke en operationele context creëert samen met een semantische betekenis, is ook metadata. Adams zei:

“Metadata is zo ongeveer alles. Het is hoe je het visualiseert, en het is hoe je het vindt. Het maakt gegevens volledig mogelijk, en in veel opzichten wordt het het grootste deel van de gegevens die je hebt. “

Typen metagegevens

  • Beschrijvende metadata zijn metadata over het item, inclusief de titel, maker, onderwerp, bron, trefwoorden, enz.
  • Metadata van contentclassificatie beschrijft de inhoud en betekenis van het gegevensmiddel. Dit omvat relaties, datamodellen, entiteiten, de zakelijke woordenlijst, gecontroleerde vocabulaires, taxonomieën en ontologieën.
  • Administratieve metadata geeft informatie over toegang tot en gebruik van gegevensactiva en omvat informatie over afkomst, structuur, audit en controle en bewaring.
  • Gebruik metadata geeft aan hoe gegevens mogen worden gebruikt en hoe deze moeten worden beheerd, waaronder gebruikers, rechten, vertrouwelijkheid en gevoeligheid.

En alsof dat nog niet ingewikkeld genoeg is, “zei hij,” worden die vier soorten metadata iets anders toegepast, afhankelijk van waar je bent. ”

Metadata voor operationele systemen

Adams gaf een illustratie van een operationeel systeem met behulp van een piramide, met rapporten op het hoogste niveau, transactiegegevens op het tweede niveau, vervolgens functionele gegevens op niveau drie, masterdata op niveau vier en structurele en referentiegegevens als de basis van de piramide. . Typen gegevens die niet in deze structuur zijn opgenomen, kunnen een data lake gebruikt door marketing, externe gegevens, financiële informatie of CRM-gegevens:

“Dit wordt ingewikkeld, dus we gaan praten over vereenvoudiging. Mijn punt hier is dat je het vanuit het gebruikersperspectief moet besturen, met die use case, het in deze context bekijken en het op de juiste manier gebruiken. “

Hoe zijn metagegevens belangrijk?

Metadata beantwoordt kritische vragen over data:

  • Zijn de gegevens vindbaar?
  • Is het begrijpelijk?
  • Is het toegankelijk?
  • Is het bruikbaar?

Succes in Metadatabeheer blijkt uit hoe goed een team informatie betrekt en afstemt op de zakelijke en operationele context van de organisatie, zei Adams. De DMBoK2 zegt dat metadata net als andere gegevens beheer vereist. Naarmate de capaciteit van organisaties om te verzamelen en op te slaan toeneemt, wordt de rol van metadatamanagement steeds belangrijker. Om data-drive te zijn, en organisatie moet metadata-gestuurd zijn.

Succes met metadatabeheer

Om metagegevens te beheren, begint u met een raamwerk dat gegevens afstemt op zakelijke en operationele contexten, zodat metagegevens kunnen worden ondersteund Gegevensbeheer op de volgende gebieden:

  • Organisatorische impact
  • Mogelijkheden en interfaces
  • Programma’s en platforms
  • Opslagplaatsen

Adams brak vervolgens verder uit hoe het bestuur van elk van deze vier gebieden moest worden aangepakt.

Organisatorische impact

Metadata zet kritische ‘data’ om in kritische ‘informatie’. Kritieke informatie is data + metadata die Key Performance Indicators (KPI’s) voeden. Hij raadt aan om te vragen: “Wat verandert er met een beter begrip van uw gegevens?” Om mensen aan boord te krijgen, moet u begrijpen hoe metadata problemen voor eindgebruikers kunnen oplossen en tegelijkertijd de bedrijfsdoelstellingen kunnen behalen. “We willen in staat zijn om te zeggen: ‘Ik doe dit en je leven wordt beter.'” Om een ​​grotere impact te hebben, zei hij, moet je ‘data speak’ vermijden en taal gebruiken die het bedrijf begrijpt. Het bedrijf vraagt ​​bijvoorbeeld niet om een ​​’woordenlijst’. In plaats daarvan zullen ze vragen om ‘een enkele kijk op de klant, geïntegreerd en afgestemd op alle bedrijfseenheden’. Een bijkomend voordeel van het gebruik van toegankelijke taal is dat het als nuttig wordt ervaren in plaats van dat het wordt gezien als een verhoging van de werklast.

Mogelijkheden en interfaces

Alle gebruikers moeten de mogelijkheid krijgen om informatie te ontdekken en deze toe te passen op uitdagingen, om kritieke informatie te delen en toegang te hebben tot geautomatiseerde processen, indien beschikbaar.

  • Ontdek en begrijp: Met een cataloguszoekportaal kunnen gebruikers ontdekken welke gegevens beschikbaar zijn, die gegevens in context plaatsen en begrijpen wie er toegang toe heeft, en hoe ze dat kunnen doen.
  • Communiceer en deel: Gebruikers moeten kunnen communiceren wat ze hebben geproduceerd en het beschikbaar maken voor bredere consumptie. Volledige beschrijvingen van gegevens zijn nodig voor naleving en consistentie, maar moeten beschikbaar zijn in taal die op de gebruiker is afgestemd. De term ‘ETL-verwerking’ kan voldoende zijn voor een IT-gebruiker, maar terminologie zoals ‘AVG-naleving ‘ moet ook beschikbaar zijn, zodat zakelijke gebruikers toegang hebben tot dezelfde informatie.
  • Verwerven en integreren: Acquisitie en integratie varieert afhankelijk van het perspectief van de gebruiker en de use case. Administratieve metagegevens stellen gegevensconsumenten in staat om gegevens te openen en te integreren in hun omgeving door het gegevenstype, het formaat en de toegangsrechten te verduidelijken. Metadata van de configuratie is belangrijk voor IT om datavoorbereiding of ETL uit te voeren. Metadata van Application Programming Interface (API) laat een programmeur zien hoe hij gegevens in een website kan integreren.
  • Integreer en automatiseer: Interactieve metadata ondersteunt geautomatiseerde processen voor communicatie en coördinatie tussen systemen.

Programma’s en platforms

Metadata ondersteunt rapportage en visualisatie, waardoor C-suite-leden betere beslissingen kunnen nemen. Metadata maakt de transformatie van activiteiten mogelijk waardoor het bedrijf kan groeien. Labeling is van cruciaal belang, zodat gegevens door de organisatie kunnen bewegen en op innovatieve manieren kunnen worden gebruikt. Zodra de gegevens begrijpelijk zijn, zei hij: “Mensen zullen die gegevens gebruiken om inzichten af ​​te leiden waarvan ze niet eens wisten dat ze het niet wisten.”

Gegevensopslagplaatsen

De bestaande informatiearchitectuur maakt de diepte, reikwijdte en kwaliteit van beschikbare metadata mogelijk of onmogelijk. Adams zei dat de discussie over repositories meer gebaseerd is op bedrijfsarchitectuur dan op gebruikersbehoeften en zakelijke prioriteiten. “Het definieert wat je in de toekomst kunt doen, en het definieert ook wat je vandaag niet kunt doen.”

Referentiearchitectuur

Bij het documenteren van het Informatie-architectuurStelt Adams voor om te focussen op hoe de informatie door de architectuur van de organisatie stroomt, in plaats van te focussen op specifieke systemen. Begin met het soort informatie en waar deze zich bevindt en geef brede toepassingen en systeemgrenzen aan. Neem gegevens op die zijn gedeeld met mensen buiten de organisatie. Hoewel het van cruciaal belang is om te begrijpen wat er binnen de organisatie gebeurt, is het vanuit een risicoperspectief, als het om risico’s gaat, belangrijker om te begrijpen wat er buiten de organisatie gebeurt. “Het interessante hiervan is dat je het als communicatiemiddel wilt gebruiken”, zei hij. Als het in eerste instantie te complex is voor zakelijke gebruikers om te begrijpen, vereenvoudig het dan een beetje. Het belangrijkste is om mensen aan boord te krijgen.

Gegevensbeheer

Governance-metadata worden vaak over het hoofd gezien Bedrijfsintelligentie (BI) voor uw data: metadata over metadata. Metadata zijn verbonden Bedrijfsstrategie, Datastrategie, Datamanagement en operations met Data Governance. “‘Hoe staat het met mijn metadata in mijn ecosysteem?’ Dat is een beetje een gek concept voor mensen om te begrijpen. ” Enterprise-architecturen en gegevensreferentiemodellen zijn een poging om het bestuursbeleid op een lager niveau af te stemmen en te begrijpen, zei Adams.

Metadata kunnen antwoorden geven op governancevragen, zoals:

  • Hoe weet ik of ik dit correct doe?
  • Wat is ‘goed’?
  • Implementeren we best practices? Zijn ze gedefinieerd?
  • Zijn deze gegevens voldoende gelabeld om als ‘beheerde gegevens’ te worden beschouwd?

Capaciteit opbouwen

Aangezien concurrentiefactoren op de markt blijven evolueren en veranderen, kan het vermogen om snel op te stijgen om die uitdagingen aan te gaan het verschil betekenen tussen succes en mislukking. Het ontwikkelen van nieuwe mogelijkheden, het schalen om aan de vraag te voldoen en het beheersen van risico’s vereist het vermogen om rapporten op te halen met behulp van gegevens op manieren die vooraf onmogelijk te anticiperen zijn, zei Adams. “Als dat de omgeving is die u wilt, dan wilt u goed gelabelde gegevens waarmee u kunt draaien, een soort schema-on-demand-activiteit en een zeer flexibel perspectief.”

Wilt u meer weten over de aankomende evenementen van DATAVERSITY? Bekijk onze huidige line-up van online en persoonlijke conferenties hier.

Hier is de video van de DGVision-presentatie:

Afbeelding gebruikt onder licentie van Shutterstock.com

follow:
Jernst van Veen

Jernst van Veen

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige