
De meeste bedrijven zijn geneigd te vertrouwen op relationele databasebeheersystemen (RDBMS) om zakelijk inzicht te verschaffen, inclusief continue informatie. Relationele databases in de cloud hebben verbeterde rekenkracht die ze naar de tafel brengen, om grotere hoeveelheden gegevens te verwerken. Echter, relationele databases, zelfs die in de cloud, kampen met twee problemen. Ze hebben het moeilijker met de ongestructureerde big data en enorme geheugenvereisten. Hun vaste schema-architectuur maakt het moeilijk om een groot deel van de continue intelligentie te onderhouden.
Gartner voorspelt, tegen 2022, meer dan “de helft of grote nieuwe bedrijfssystemen zullen continue intelligentie bevatten”. Continue intelligentie vereist het omzetten van big data in realtime analyses die de bedrijfsvoering kan gebruiken om acties voor te schrijven. Toch worstelen veel bedrijven met het vinden van een databaseoplossing voor algemeen gebruik die snel reageert, enorme hoeveelheden gegevens van alle soorten verwerkt, schaalbaar is over meerdere computerinstanties, goed presteert en consistent en bestuurbaar blijft.
Het verlangen naar een snellere, beter presterende en flexibelere architectuur leidde tot de ontwikkeling van de niet-relationele of NoSQL-databases. NoSQL-databases hebben minder opslagbehoeften, kunnen beter omgaan met big data en verwerken opgenomen gegevens snel. Als DATAVERSITY® Trends in datamanagement 2019 report vermeldt, voelen veel bedrijven zich overweldigd door te begrijpen hoe ze zakelijk inzicht kunnen krijgen uit de NoSQL-database en de bijbehorende architectuur.
DATAVERSITY sprak onlangs met Jai Karve, een Solutions Architect bij MongoDB, om niet-relationele databasetechnologie beter te begrijpen, hoe deze is voorbereid op continue intelligentie, terwijl hiaten worden gedicht met RBDMS-voordelen om meer algemene doeleinden te worden.
Gegevens sneller en over meer machines verplaatsen
NoSQL-technologie kwam van een drive om “gegevens snel te verplaatsen” en “goed horizontaal uit te schalen”, zei Karve. Ga terug naar 2008 en ontdek dat streaming media-applicaties zoals Twitter en YouTube steeds populairder worden. Die applicaties verzamelden continu gegevens sneller en sneller, en het RDBMS ondervond prestatieproblemen bij het proberen alles af te handelen.
“Daarom keken sommige NoSQL-ontwikkelaars hoe ze gigantische datasets over meerdere machines konden distribueren. Ze wilden rijke JavaScript Object Notation (JSON) -datastructuren mogelijk maken die zijn ontworpen om verzoeken en reacties tussen computers te versnellen en tegelijkertijd uit te breiden naar vele netwerkcomputers. Het resultaat is dat NoSQL-technologie presteert als een kant-en-klaar big data-platform als een service, waarmee ontwikkelaars data-applicaties kunnen bouwen. “
Omdat ze graag feedback wilden krijgen over dit nieuwe soort architectuur, werd de niet-relationele databasecode open source, waar ontwikkelaars het konden uitproberen, wijzigen, problemen konden indienen en verbeteringen konden voorstellen. Zoals hij opmerkte, bleven bedrijven de niet-relationele database als een anomalie beschouwen.
“Bedrijven bleven hun RDBMS gebruiken voor een recordsysteem en keken naar een NoSQL-database, zoals MongoDB, om Application Programming Interfaces (API’s) te bouwen en JSON-mogelijkheden te gebruiken voor prestaties en snelheid. De markt zag de NoSQL-database dus als een oplossing voor een niche-use case, een caching-laag om opgeslagen gegevens sneller te serveren. “
Hoewel de NoSQL-databases streefden naar meer algemeen gebruik, misten ze essentiële kenmerken, waaronder gegevensvalidatie en ACID-a-compatibele transacties. ZUUR beschrijft atomaire, consistente, geïsoleerde en duurzame database-eigenschappen, ideaal voor betalingen. Elk databasesysteem dat is ontworpen om te voldoen aan ACID-kenmerken, behoudt de integriteit van elke transactie, één set bewerkingen en waarden. Daarentegen kan de NoSQL-database gegevens wijzigen vanaf het moment van invoer en uiteindelijk consistent zijn, maar niet noodzakelijkerwijs sterke garanties voor consistentie bieden.
Sommige NoSQL-technologieën probeerden deze consistentie te bereiken door gegevens op databaseniveau te vergrendelen. “Maar dan wordt het updaten of schrijven naar de database omslachtig”, zoals Karve zei, “om het gebruik van de NoSQL-database te ontmoedigen.” De NoSQL-uitdaging werd: “… de sterke punten van hoge beschikbaarheid en horizontale schaalbaarheid in NoSQL bieden, maar de kloof dichten met gewenste RDBMS-functies, zoals ACID-transacties.”
Een NoSQL-database voor algemeen gebruik met ACID-eigenschappen
In 2017 zijn de NoSQL-databasetechnologieën geëvolueerd, waarbij flexibiliteit, snelheid en prestaties zijn behouden terwijl ACID-database-eigenschappen zijn ingesloten. Karve noemde een oplossing, de document database. Elk document bevat sleutels en waarden, aangepast aan gebruikersspecificaties. De inhoud, het aantal en de reeks documenten in een documentendatabase kennen weinig beperkingen, waardoor deze ideaal is voor big data.
Karve legde uit dat MongoDB ACID-eigenschappen aan dit document Data Architecture heeft toegevoegd. Ten eerste valideren algoritmen inhoud die naar JSON-documenten is geschreven. Beschouw deze code als een manier om de datakwaliteit te behouden door te controleren of de inhoud van het document voldoet aan de bedrijfsregels en -vereisten en degene die dat wel doen te behouden, te vergrendelen. Deze programmering maakt transacties atomair en consistent.
De duurzaamheid van de NoSQL-database is afkomstig van een replicaset. Elk gegevenscluster bevat een primair knooppunt, dat databaseschrijfbewerkingen accepteert en secundaire knooppunten die de schrijfbewerkingen repliceren. Wanneer het primaire knooppunt uitvalt, wordt een van de back-upknooppunten primair. Gegevens kunnen zeker server- of netwerkstoringen doorstaan als een nieuw knooppunt opstapt om primair te worden.
MongoDB ontwerpt een ACID-database, een datacluster met een reeks JSON-documenten, geconfigureerd en gecontroleerd door code. In de tussentijd kan het bedrijf vervolgens zoveel dataclusters opschalen als nodig is over meerdere locaties of flexibel beslissen hoe dat moet.
Een Continuous Intelligence-databasearchitectuur
Het is een uitdaging om te begrijpen hoe u continue informatie uit de NoSQL-architectuur van de documentdatabase kunt halen. Karve merkte op:
“Mensen blijven steken in relationele database-bagage terwijl ze proberen hun databasemodel in een documentendatabase te koppelen. Ze proberen normalisatie te bereiken door gegevens te ordenen om te voldoen aan een schema op basis van relaties. Klanten hebben dan een vreselijke ervaring. Startend, zakelijk voordeel door een paradigmaverschuiving door te voeren. Ze moeten nadenken over gegevensopslag en toegang bij het modelleren van gegevens. Houd gelijke gegevens bij elkaar om toegang te krijgen. Denk minder aan dozen en meer aan details van elk datacluster. “
MongoDB realiseerde zich dat bedrijven vast kunnen komen te zitten in een RDBMS-perspectief en creëerde The Toolkit voor modernisering met enkele partners. “Deze grafische interface helpt bedrijfsanalisten om van RBDMS naar dataclusters in kaart te brengen, waardoor ze NoSQL beter begrijpen continue intelligentie datamodellering.”
Voor degenen die hun relationele schema willen behouden, integreren leveranciers, zoals Confluence, NoSQL- en SQL-technologieën en verbinden ze bedrijfstools. Het resultaat is een “krachtig platform waarmee bedrijfsanalisten eenvoudig toegang hebben tot real-time screening van gebeurtenissen, terwijl die continue intelligentie wordt getransformeerd met SQL-queries.” Voorbeelden zijn ook Tableau en PowerBI, die realtime interactieve dashboards en rapporten bieden die met SQL kunnen worden opgevraagd.
Gegevensclusters beheren
Real-time interactieve dashboards geven slechts zo goede informatie als de datakwaliteit binnen de databasesystemen. Maar wat gebeurt er als de zakelijke vereisten veranderen? Karve merkte op:
“Sommige medewerkers gebruiken een open source documentendatabase om dingen snel gedaan te krijgen. Maar dan een veelvoud aan verschillende praktijken die na verloop van tijd worden geërfd. Het bedrijf weet niet hoe het die database moet beheren of beheren zodra werknemers vertrekken. “
Hij legde uit hoe MongoDB dit soort behandelt Gegevensbeheer probleem, de clouddatabaseservice die bekend staat als Atlas. Beschouw Atlas als een controlecentrum voor dataclusters die in de cloud zijn opgezet. Mongo doet het “zware werk van de NoSQL-databasestructuur”, terwijl het bedrijf “de hendels, knoppen en knoppen heeft om de parameters van het datacluster in te stellen”. Van daaruit kan een onderneming de gegevensprestaties en -locaties verfijnen.
Hoe is dit van toepassing op Data Governance? Als u de datalocatie kent, moet u weten welke regels van toepassing zijn op de gegevens die daar zijn opgeslagen. Aangezien overheden verschillende privacynormen hanteren, wordt het gemakkelijker om de dataconfiguraties bij te werken om te voldoen aan nieuwe wetten of om de gegevens naar een andere locatie te verplaatsen zonder de regelgeving.
Combineer deze mogelijkheid onder een bedrijfsbrede Data Governance-paraplu en krijg een krachtige manier om gegevensbeleid en -procedures te verfijnen en flexibel te beheren.
Streaminggegevens gebruiksvriendelijker maken met uitgebreide schaalbaarheid
De toekomst van NoSQL-technologie ziet er rooskleurig uit voor continue intelligentie. Ten eerste beloven NoSQL-databases gebruiksvriendelijker te zijn door middel van autonome databasefuncties. Karve legt uit: “MongoDB zal gebruikersgedrag detecteren en suggesties geven voor databasemodellering
en het maken van een index. ” Met indexering worden zoekresultaten sneller opgehaald.
Ten tweede zal de documentendatabase van MongoDB zijn capaciteit uitbreiden om meer mobiele apparaten en het internet der dingen (IoT) te verwerken. Karve zei: “Hierdoor kunnen de dataclusters aan de rand van het netwerk beter synchroniseren met de server.” De NoSQL-technologie maakt gebruik van 5G-technologie met een hogere verbindingssnelheid, waardoor meer gegevensinvoer via streaming mogelijk is.
Bedrijven hebben NoSQL-technologie nodig om gebruik te maken van continue intelligentie vanwege de flexibiliteit, prestaties en betrouwbaarheid. Zie bovendien, op basis van de recente COVID-19 pandemische activiteiten, het omarmen van multi-cloud-mogelijkheden als een veerkrachtiger en elastischer manier om gegevens op te slaan en downtime te voorkomen. NoSQL-databases schalen uit met prestaties over veel clouds, waardoor u meer continue gegevens kunt vastleggen en waar u deze kunt plaatsen. RDBMS alleen heeft niet de architectuur om multi-cloud data en continue intelligentie te verwerken.
Afbeelding gebruikt onder licentie van Shutterstock.com