Het belang van gegevenskwaliteit voor blockchain

Het belang van gegevenskwaliteit voor blockchain

Wat is het verband tussen datakwaliteit en blockchain? Dan Myers, belangrijkste opvoeder informatiekwaliteit bij DQMatters en de uitgever van De conforme dimensies van gegevenskwaliteit – die probeert de datamanagementgemeenschap op één lijn te brengen door gemeenschappelijke definities te gebruiken – heeft het probleem tijdens zijn Enterprise Data Wereldconferentie presentatie getiteld “Verbeterde datakwaliteitsimplicaties met Blockchain

Blockchain zou de datakwaliteit aanzienlijk moeten verbeteren. Het gaat allemaal om eigendom, merkte hij op – of het nu om geld, onroerend goed of iets anders ging – en om de overdracht ervan en hoe die gegevens worden vastgelegd. Eigendom moet worden vastgesteld door identificatie van de eigenaar (s), identificatie van het object of de objecten die ze bezitten, en een mapping tussen eigenaren en objecten.

Blockchain biedt voordelen zoals de mogelijkheid om volledige audittrails van transacties te bieden en entiteiten te verifiëren die aansluiten bij de verbeteringen van de gegevenskwaliteit zoals gedefinieerd in de bevestigde dimensies van gegevenskwaliteit: volledigheid, nauwkeurigheid, consistentie, geldigheid, tijdigheid, valuta, integriteit, toegankelijkheid, afkomst, en vertegenwoordiging.

Myers putte uit een theoretisch voorbeeld van hoe Blockchain autogerelateerde transacties kan verbeteren. Er zullen meerdere stappen plaatsvinden van een opnieuw ontworpen bedrijfsproces dat complementair is aan de dimensies datakwaliteit: de papieren titel kan digitaal worden verspreid, in welk geval Blockchain de echte wereld verbindt met de digitale met zowel een afdrukbare als een digitale titel; en waar verbeteringen aan Data kwaliteit komen in de vorm van vertegenwoordiging van eigendom en verificatie hiervan aan de Blockchain. Of een privé autoverkoop met Blockchain beschermt de privacy van thuis- en postadressen en biedt validatie van de entiteit en autoriteit om te verkopen, waardoor verbeteringen in de gegevenskwaliteit mogelijk zijn voor de nauwkeurigheid van de verkoopprijs en de integriteit van de partijen die de zakelijke transactie uitvoeren.

Blockchain-achtergrond – Dimensies van gegevenskwaliteit

Blockchains, die opereren in een peer-to-peer-systeem van grootboeken, zijn opgeslagen netwerkknooppunten en gebruiken software-eenheden die bestaan ​​uit algoritmen die onderhandelen over informatie-inhoud van geordende en verbonden gegevensblokken, samen met cryptografische en beveiligingstechnologieën. “Vanuit een architectonisch perspectief rol je deze allemaal op tot een logische oplossing om de integriteit ervan te bereiken en te behouden”, zei Myers.

Aangezien Blockchain betrekking heeft op cryptografie, bestaan ​​er bijvoorbeeld openbare sleutels om identiteiten en privésleutels voor autorisatie te beheren, die belangrijk zijn voor Data kwaliteit. Transacties tussen unieke individuen nemen de vorm aan van het identificeren van individuen aan de hand van hun openbare sleutels en het gebruik van hun handtekeningen die betrekking hebben op hun privésleutels om de overeenkomst en goedkeuring van elke transactie te documenteren. “U voert transacties uit en ze zijn ingesloten of overeengekomen door de toevoeging van een sleutel die de envelop van de transactie afsluit”, zei hij. “De echte sleutel hier is unieke individuele identificatie.”

Omdat het betrekking heeft op client-server en gedistribueerde grootboekarchitectuur, wordt een kopie van een hele blockchain opgeslagen in een gedistribueerde context op elk knooppunt. Elke deelnemer onderhoudt, berekent en voegt nieuwe posten toe aan zijn eigen grootboek en synchroniseert met alle andere. “Gedistribueerde consensus wordt gebruikt om ervoor te zorgen dat alle knooppunten tot dezelfde conclusie komen”, zei hij.

Wat betreft integriteit – een onveranderlijke datastructuur – gebruikte hij de analogie van een boek, waarvan de pagina’s opeenvolgend zijn. “Als je mee leest en iets leest dat naar iets anders verwijst, heb je de integriteit van het boek nodig – de volgorde ervan – dus je leest die pagina,” zei hij. Maar als een pagina wordt verwijderd, weten lezers dat de integriteit is aangetast.

Aangezien het betrekking heeft op integriteit en transactiehash-waarden in de datastructuur, creëert het genesisblok een hash, of digitale handtekening, van het eerste blok dat het eerste stuk data bevat. De tweede transactie creëert een hash van zowel het tweede stuk gegevens als de hash van de vorige transactie, waardoor de twee met elkaar worden verbonden. Elk datablok wordt dus uniek geïdentificeerd via elke hash, die hoogstwaarschijnlijk niet wordt gedupliceerd. Met deze unieke sleutels is het mogelijk om te koppelen of samen te voegen met andere “off-chain” datastructuren, waardoor de referentiële integriteit tussen de transactie in de keten en aanvullende gegevens die elders zijn opgeslagen, wordt gegarandeerd.

Consistentie en integriteit zijn de twee belangrijkste dimensies van datakwaliteit die het meest van toepassing zijn op Blockchain. “De gelijkwaardigheid of redundantie van gedistribueerde gegevens is een maatstaf voor de gelijkenis van andere gegevensbronnen die hetzelfde concept vertegenwoordigen”, zei hij – dat wil zeggen, consistentie. Terug naar het voorbeeld van de auto, de koper weet dat de verkoper de auto heeft verkocht, maar anderen niet totdat het gedistribueerde grootboek is gesynchroniseerd en er overeenstemming is tussen zoveel mensen als nodig is om de consistentie van de transactie te waarborgen. Integriteit, zoals gedefinieerd in het Conforme dimensies van gegevenskwaliteit, is robuust voor de Blockchain doel omdat het de structurele of relationele kwaliteit van datasets meet.

Vragen die moeten worden beantwoord, problemen die moeten worden aangepakt

Er zijn, meende Myers, vragen rond unieke sleutels die linken naar off-chain datastructuren. Hoe, vroeg hij, kan worden omgegaan met de kwaliteit van gegevens die buiten de keten zijn opgeslagen, omdat mensen grote hoeveelheden gegevens in de Blockchain willen pompen? “Je stopt meestal niet veel data in een Blockchain om prestatieredenen en gedistribueerde grootboekimplicaties”, zei hij. “De CEO kan komen en zeggen ‘laten we het datawarehouse neerhalen en alles erin stoppen in een blockchain, zodat het allemaal in overeenstemming is en er geen problemen met de datakwaliteit zijn.’ Dat is niet de manier om dingen op te lossen, ”zei hij.

“Hoeveel data je in de Blockchain stopt, is een grote architectonische vraag die mensen nu proberen te achterhalen”, zei hij.

Er is ook het probleem met de gegevenskwaliteit dat kan ontstaan ​​omdat gegevensintegriteit niet hetzelfde is als gegevensnauwkeurigheid. Slechte gegevens kunnen correct in een systeem worden ingevoerd, “maar dat geeft de echte wereld niet nauwkeurig weer”, merkte hij op.

Myers heeft gesuggereerd dat bedrijven het volgende overwegen als ze verder gaan met Blockchain:

  • Weet wat “eigendom” is en wie de leveranciers zijn en ken de behoeften aan datakwaliteit van uw bedrijf.
  • Begrijp de componenten van Blockchain en die je echt nodig hebt.
  • Onderzoek alternatieve architecturen / methoden om te zien of er vergelijkbare voordelen zijn met minder hype en risico / kosten.
  • Ga vooruit met Blockchain / distributed ledger-technologie met wijd open ogen.
  • En bepaal of alles aan de ketting moet zitten en waarom.

Wilt u meer weten over de aankomende evenementen van DATAVERSITY? Bekijk onze huidige line-up van online en persoonlijke conferenties hier.

Het belang van gegevenskwaliteit voor blockchain

Hier is de video van de Enterprise Data World-presentatie:

Het belang van gegevenskwaliteit voor blockchain

Afbeelding gebruikt onder licentie van Shutterstock.com