Eva_Murray_600x448.jpg

Hoe u de uitdagingen van het gebruik van een gegevenskluis kunt overwinnen

Klik voor meer informatie over auteur Eva Murray.

Wat zijn de uitdagingen?

Van flexibiliteit tot schaalbaarheid en efficiëntie, het gebruik van een datakluis als uw datamodellering heeft vele voordelen. Maar tegelijkertijd zijn er uitdagingen waarvan u zich bewust moet zijn. In deze blog ga ik je door de beperkingen heen leiden en hoe je ze kunt overwinnen.

De benadering die een gegevenskluis volgt bij het modelleren van gegevens (iets waar ik verderop in zal ingaan) resulteert in een aanzienlijk grotere hoeveelheid gegevensobjecten in vergelijking met andere benaderingen. Deze objecten omvatten zaken als tabellen en kolommen, en de reden dat er zoveel meer zijn, is omdat een gegevenskluis informatietypen scheidt.

Als gevolg hiervan kan de inspanning voor het vooraf modelleren groter zijn om de resulterende voordelen – hierboven vermeld – als eindresultaat te accommoderen. Het betekent ook dat er tijdens het modelleerproces een groter aantal handmatige of mechanische taken betrokken kunnen zijn om het flexibele en gedetailleerde datamodel met al zijn componenten vast te stellen.

Hoe kunnen deze beperkingen worden aangepakt?

Om tijdrovende handmatige taken tijdens het modelleringsproces te vermijden, kunnen architecten delen van het model automatiseren, waardoor het efficiënter wordt om op de lange termijn te creëren, bij te werken en te onderhouden.

Hoe kunnen ze dat doen?

Binnen de datakluisbenadering zijn er bepaalde gegevenslagen. Deze variëren van de bronsystemen waar de gegevens vandaan komen, tot een verzamelplaats waar gegevens uit het bronsysteem arriveren, gemodelleerd volgens de oorspronkelijke structuur, tot het kerndatawarehouse, dat de onbewerkte kluis bevat, een laag die het mogelijk maakt om terug te gaan naar het origineel. bronsysteemgegevens en de zakelijke kluis, een semantische laag waar bedrijfsregels worden geïmplementeerd. Ten slotte zijn er datamarts, die zijn gestructureerd op basis van de eisen van het bedrijf. Er kan bijvoorbeeld een datamart voor financiën of een datamart voor marketing zijn, waar de relevante gegevens voor staan analyse doeleinden.

Van deze lagen zijn de verzamelplaats en de onbewerkte kluis het meest geschikt voor automatisering.

Wat zijn de kenmerken van gegevenskluismodellering?

De datakluis-modelleringstechniek zorgt voor ultieme flexibiliteit door de bedrijfssleutels, die elke bedrijfsentiteit uniek identificeren en niet vaak veranderen, te scheiden van hun attributen. Dit resulteert, zoals eerder vermeld, in veel meer data-objecten die in het model zitten, maar biedt ook een datamodel dat zeer snel kan reageren op veranderingen, zoals de integratie van nieuwe databronnen en business rules.

De basisstructuur van het model komt voort uit de bedrijfssleutels en de relaties daartussen. Hun stabiele karakter vormt het belangrijkste ingrediënt voor een robuust datamodel, maar betekent ook dat de sleutels zorgvuldig moeten worden gekozen, omdat ze de basis vormen waarvan al het andere is afgeleid.

Naven

De tabellen die de bedrijfssleutels bevatten, worden hubs genoemd in de datakluisbenadering. Naast het opslaan van de sleutels bevatten hubs ook surrogaatsleutels en metadata voor elke bedrijfssleutel. Ten slotte is in de hub ook de bron van elke business key te vinden, zodat informatie terug te herleiden is naar de oorsprong.

Links

Koppelingstabellen zijn veel-op-veel-samenvoegtabellen die verschillende bedrijfssleutels met elkaar verbinden. In linktabellen vindt u de informatie die u vindt de surrogaatsleutels voor de hubs die via de link zijn verbonden, evenals de surrogaatsleutel voor de link en de metadata over waar de associatie vandaan komt.

Satellieten

Met de hubs en links op hun plaats, wordt de structuur van het datakluis-model opgezet. Het bevat echter nog geen attributen. Dit is waar satellieten binnenkomen. Satelliettafels bevatten metagegevens die hen verbinden met hun bovenliggende hubs en koppelingstabellen. Ze bevatten ook metadata over de oorsprong van de attributen, evenals temporele attributen. Dit betekent dat data-architecten dankzij satellieten ervoor kunnen zorgen dat de geschiedenis met elk interval wordt geregistreerd, terwijl ze ook een audittrail en traceerbaarheid naar het bronsysteem bieden.

Hoe werkt een datakluis?

In u beschikt over een database waarmee u flexibel kunt werken met een overvloed aan tools en methodologieën, zodat u de juiste aanpak voor uw bedrijf en overkoepelend kunt kiezen analytische strategie.

Wij ondersteunen u volledig bij het kiezen van de datamodelleringstechniek die het beste bij uw strategie past. Dit betekent dat u eenvoudig kunt profiteren van de voordelen van een datakluis.

Partners zoals Datavault Builder en Wherescape hebben tools voor datamodellering en magazijnautomatisering ontwikkeld die moeiteloos met de database kunnen worden geïntegreerd.

U kunt uw datamodel ook rechtstreeks in onze database bouwen met behulp van het UDF Framework.

Breng prestaties naar uw gegevenskluis gemodelleerde gegevens

Het modelleren van uw gegevens in een datakluis kan ertoe leiden dat complexe SQL-query’s worden uitgevoerd in uw datawarehouse. Onze architectuur en puur ontwerp zorgen ervoor dat de uitstekende prestaties die we u beloven gedurende de gehele levenscyclus van gegevens behouden blijven, inclusief uw gegevensmodellering en warehousing processen.

U kunt historische queryresultaten snel en efficiënt controleren en reproduceren, terwijl u ook al uw grote datavolumes in het magazijn laadt en uw analisten en datawetenschappers uitnodigt om hun workflows, analyses en analytische modellen rechtstreeks in het datawarehouse uit te voeren zonder in te boeten aan snelheid en betrouwbaarheid.

Partnerschappen zijn gericht op het verbeteren van de gebruikerservaring, daarom is feedback en gezamenlijk werken aan de continue ontwikkeling en integratie van producten cruciaal.

Je kan kijken deze video om een ​​indruk te krijgen van een samenwerking met een team dat effectief een datakluis gebruikt.