Verenig gegevensbeheer met gegevensarchitectuur

Denk aan een organisatie die probeert een enkel begrip te creëren van de informatie van de organisatie en de instanties van die gegevens rond haar landgoed. Beschouw verschillende groepen mensen die aan dit model bijdragen en dit gebruiken vanuit verschillende perspectieven en verschillende redenen. En bekijk dit in de context van Data Governance, Data Architecture of Business Intelligence. Een ogenschijnlijk eenvoudige taak wordt zo ingewikkeld als zes blinde mannen het bouwen van een model van een olifant. Elke blinde man heeft een ander perspectief op de olifant. Dit is vergelijkbaar met belanghebbenden en personeel, verspreid over de organisatie, met verschillende opvattingen en implementaties van Data Governance.

Het resultaat is dat veel organisaties eindigen met kennissilo’s die fundamenteel anders zijn, eigendom zijn van verschillende groepen en voor verschillende doeleinden worden gebruikt. Dit brengt risico’s en kosten met zich mee voor een organisatie waar Data Governance belangrijk is. De data-architect bevindt zich hier in het centrum en heeft vaak de meest volwassen en gedetailleerde weergave van informatie en data. Data-architecten hebben echter moeite om de silo’s en de betrokken teams te verenigen.

Jamie Knowles, Product Manager voor IDERA, heeft geluisterd naar de pijn van de data-architecten. In een recent DATAVERSITY®-interview besprak Knowles de uitdagingen van het integreren van verschillende gezichtspunten van Data Governance. Hij geeft suggesties over hoe de data-architect Data Governance kan stroomlijnen naar een ondernemingsbeeld van het informatie-ecosysteem van de organisatie.

Drie verschillende implementaties van gegevensbeheer

Knowles ziet dat problemen met Data Governance ontstaan ​​door verschillende activiteiten tussen “stammen”. Elke stam gelooft dat ze zich bezighouden met kennis van de informatie en gegevens van de organisatie.

De eerste stam werkt binnen IT en neemt traditioneel eigenaarschap voor informatie en gegevens. Ze erkennen dat een organisatie zowel informatie als dataconcepties in één datamodel moet hebben. Voer het data architect met traditionele logische en fysieke datamodellen. Volgens Knowles:

“Data-architecten verbinden de perceptie van informatie van gebruikers en consumenten met technologie. In het verleden hebben data-architecten logische datamodellen geconstrueerd om informatie te begrijpen en deze te gebruiken om databases te documenteren en te ontwerpen die als fysieke datamodellen worden bewaard. Ze zullen goed gedefinieerde modellen beheren die rijk zijn aan waardevolle kennis. “

Afbeelding tegoed: IDERA

De tweede stam is recenter en is een machtige groep die verantwoordelijk is voor Data Governance. Deze groep bevindt zich vaak buiten IT en heeft leiding in of nabij de C-level groep, zoals de Chief Data Officer.

“De Data Governance-stam biedt standaarden voor concepten die iedereen moet begrijpen om zaken te doen, op basis van de waarden van de organisatie en hun belang. Ze moeten bijvoorbeeld duidelijk definiëren wat een klant voor een onderneming betekent, welke regels voor hen gelden. Dit omvat gerelateerde concepten zoals bestellingen, werknemers, adressen en producten “

De Data Governance-stam bestaat uit een netwerk van datastewards die informatie catalogiseren als zakelijke termen en bedrijfseigenaren toewijzen aan die concepten. Datastewards en eigenaren nemen de verantwoordelijkheid voor bedrijfsinformatie, inclusief attributen, regels, kwaliteit en vereisten. Een zakelijke woordenlijst deelt deze zakelijke woordenschat met consistente betekenissen.

De derde stam is de datatam die de Data Governance-stam ondersteunt:

“De datatam houdt zich bezig met data, de grondstof waaruit de informatie bestaat die een organisatie nodig heeft. Dit omvat documenten, databases en platte bestanden. In dit dataperspectief wordt Data Governance opgevat als lijsten met data-assets, met inventarissen van technische metadata rond de ingrediënten waaruit informatie bestaat. “

De datastam stelt gegevensbeheerders in, meestal IT of operations, om het gegevensbeheer af te handelen. Gegevensbewaarders documenteer de structuur van activa, toegankelijkheid en beveiligingsdetails. Ze leggen ook de gegevenskwaliteit vast en documenteren het technische gebruik. Al deze informatie wordt bewaard in een datadictionary. De gegevensbewaarders classificeren hun gegevensactiva in de datadictionary met de zakelijke woordenlijsten om een data catalogus, die is ontworpen om gemakkelijker te zoeken tussen beschikbare datasets.

Afbeelding tegoed: IDERA

De vierde en laatste stam houdt zich bezig met de analyse van gegevens om inzicht te geven aan de organisatie. Dit is de Business Intelligence-stam die zich bezighoudt met datawarehouses, datameren en analysetools.

“De Business Intelligence-stam staat voor de uitdaging om nauwkeurige gegevens in context te leveren om organisatorische vragen op te lossen. Weten welke gegevens ze hebben, waar deze zich bevinden, en de context en kwaliteit van die gegevens is essentieel. Hun doel is om goede data snel en efficiënt beschikbaar te maken voor consumenten. Ze moeten ook de regels begrijpen die van toepassing zijn op gegevens. “

Knowles ziet elke stam opereren Gegevensbeheer afzonderlijk en niet met elkaar gesynchroniseerd.

Een verenigd ecosysteem van informatie

Een Data Governance-toolset moet informatie en data in de belangrijkste typen datamodellen van verschillende tools die door verschillende stammen worden gebruikt, samenbrengen tot een aaneengesloten gestandaardiseerd Data Governance-model voor de hele organisatie. Deze enkele weergave wordt in de praktijk zelden gezien. Knowles zei:

“Onze klanten hebben verschillende tools. Ze hebben wellicht Collibra of Informatica die eigenaar is van de zakelijke woordenlijst. De tools voor het catalogiseren van gegevens kunnen daar ook ergens staan ​​of bij een andere leverancier. Het is essentieel dat we al deze kennis samenbrengen. We willen mensen en tools toestaan ​​om samen te werken binnen dit ene begrip. “

Traditioneel heeft de data-architect logische modellen gemaakt voor het ontwerpen van een database, het consolideren van sommige datasystemen of het migreren naar nieuwe technologie. Bedenk dat een organisatie gegevens via Snowflake in de cloud naar een fris, nieuw glanzend datasysteem of een datawarehouse verplaatst. Dit moet gebeuren binnen een Data Governance-raamwerk. Het verplaatsen van gevoelige gegevens naar buitenlandse locaties kan juridische en veiligheidsimplicaties hebben. De inhoud van dit datasysteem moet goed worden begrepen en er moet rekening worden gehouden met de bijbehorende regels. Als het een datawarehouse is, moeten de gegevens samen met de kwaliteit en context aan de consument worden geadverteerd.

Enter IDERA’s ER / Studio-platform. Volgens Knowles zorgt ER / Studio voor de standaard Data Architecture-taken, waarbij datamodellen worden gebruikt om nieuwe en gewijzigde data-assets te documenteren en te ontwerpen. ER / Studio faciliteert ook Data Governance Management als een toolset. Gebruikers kunnen bouwen een of meer van de drie Data Governance-documenten: een zakelijke woordenlijst, een logisch datamodel en een datacatalogus. ER / Studio is uniek omdat het data-architecten in staat stelt om de kern te zijn van dit unificatieproces en deze modellen met elkaar in één toolset verbindt.

Mogelijkheden uitbreiden om gegevensbeheer te verenigen

Knowles ziet dat ER / Studio informatieve, logische en fysieke Data Governance-implementaties op één plek stroomlijnt terwijl de typische Data Architecture-taken worden uitgevoerd, zoals het documenteren hoe en waar gegevens in een platform moeten worden geplaatst. Knowles en IDERA zijn van plan om deze mogelijkheden nog een stap verder te zetten verder door de integratie van Data Governance nog toegankelijker te maken.

In het komende jaar zal ER / Studio zijn Data Governance-functionaliteit uitbreiden, te beginnen met de zakelijke woordenlijst.

  • Geavanceerde ontologie-ondersteuning: IDERA begrijpt dat het informatiemodel dat als zakelijke termen in de woordenlijst wordt gehanteerd, kan worden samengevat in een ontologie die taxonomieën van geclassificeerde concepten. Knowles zei:

“Men kan het concept vormen van een persoon waarvan een klant, werknemer en medewerker verschillende typen zijn, elk met subtypen. Hier vormt de zakelijke woordenlijst een taxonomieboom. Maar men denkt ook aan klanten binnen een bredere ontologie. Een persoon die een bestelling voor een product plaatst, kan bijvoorbeeld worden gezien als een klant die een bestelling voor een product plaatst. In deze context heeft de klantpersoon specifieke kenmerken, regels en beperkingen die we moeten begrijpen. “

ER / Studio heeft taxonomiemogelijkheden binnen de zakelijke woordenlijst. IDERA is van plan om mogelijkheden toe te voegen aan de zakelijke woordenlijst voor het visualiseren van ontologiemodellen en het gemakkelijk vinden van de belangrijke informatie, en waar deze zich bevindt. Met deze visualisaties kan de gebruiker verkennen de ontologie en vervolgens hoe deze informatie wordt gerealiseerd als gegevensactiva. De gebruiker kan de importvragen stellen “Welke informatie is belangrijk voor ons?” “Hoe verhoudt het zich?” en waar is het?”

  • Gegevensclassificatie in Data Architect: Zoals we hebben beschreven, is een kernonderdeel van Data Governance het verbinden van het informatiemodel met kennis van de data-assets. Data-architecten zijn essentieel om menselijke kennis hierover te verstrekken om andere stromen te ondersteunen, zoals componenten voor kunstmatige intelligentie en machine learning. ER / Studio zal betere mogelijkheden bieden om dit classificatieproces uit te voeren in de tool die ze gebruiken voor hun kerntaken. Knowles benadrukte het belang van het gebruik van data-architecten op deze manier vanwege hun unieke kennis en ervaring met de assets.
  • Oogsten op zakelijke termijn: Deze functionaliteit maakt gebruik van het logische model. “Op basis van het enorm waardevolle kenniskapitaal in logische modellen, kunnen organisaties een lijst met zakelijke termen, hun definities en relaties genereren om hun zakelijke woordenlijsten te zaaien”, aldus Knowles.

Naast het verbinden van andere Data Governance-platforms, zal IDERA de ondersteuning voor databaseplatforms in ER / Studio vergroten. Deze omvatten de recente ondersteuning voor Sneeuwvlok en Azure SQL Data Warehouse Synapse, naast het verbeteren van de functies voor Microsoft SQL Server. Ten slotte zal ER / Studio zich bezighouden met verbeteringen voor ondersteunde platforms om te integreren met clouddatabases, en de gebruikersinterface, prestaties en beveiliging verbeteren. Integratie met de leidende WhereScape product (eigendom van IDERA’s moederbedrijf, Idera, Inc..) is ook de sleutel, het kunnen leveren van een naadloze reis van het opvragen van informatie tot sourcing, voorbereiding en levering via het magazijn.

Knowles waarschuwde dat Data Governance-initiatieven vele vormen aannemen volgens het tribale perspectief en de kennis. De ene groep kan een gegevenswoordenlijst maken, terwijl een andere groep een gegevenscatalogus maakt, enz., Zoals de blinden die de olifant modelleren. Dit vormt een risico voor de organisatie. Om dit risico te verkleinen, moeten deze uiteenlopende opvattingen over informatie en gegevens samenwerken binnen een ecosysteem voor gegevensbeheer.

“Data-architecten moeten erkend worden voor de kennis die ze bezitten en dieper verbinden met Data Governance, door verschillende opvattingen en implementaties samen te brengen in één enkel, hoogstaand informatie-ecosysteem-gezichtspunt.”

Afbeelding gebruikt onder licentie van Shutterstock.com

follow:
admin

admin

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige