Door Ed Anuff, Chief Product Officer, DataStax
Ondernemingen in verschillende sectoren zijn al geruime tijd geobsedeerd door realtime analyses. De technologie die deze toolset aandrijft die tot doel heeft om snel cruciale zakelijke beslissingen te nemen, zal naar verwachting in 2026 een markt van $ 50,1 miljard bedragen.
Het is geen verrassing. De inzichten die door analyses “in het moment” worden geboden, kunnen waardevolle informatie in klantinteracties blootleggen en gebruikers waarschuwen of reacties activeren wanneer gebeurtenissen plaatsvinden. En deze realtime reacties zijn een cruciaal onderdeel van het opbouwen van het soort ervaringen dat uw klanten verwachten.
Maar deze schitterende prijs kan ertoe leiden dat sommige organisaties iets belangrijkers over het hoofd zien: het bouwen van het soort gebeurtenisgestuurde data-architectuur die robuuste realtime analyse ondersteunt.
Meer informatie over DataStax Astra-streaming,
die nu algemeen verkrijgbaar is
Een onderneming die zich richt op het bouwen van een op gebeurtenissen gebaseerde architectuur voor realtime applicaties, zal in een veel betere positie verkeren om een realtime analyseplatform te bouwen. Waarom? Want wanneer uw applicatiearchitectuur nauw is afgestemd op uw bedrijfsactiviteiten (zogenaamde “events”), produceert u het soort realtime gegevens dat u nodig hebt om realtime analyses op een flexibelere en schaalbare manier uit te voeren dan traditionele software-architecturen.
Laten we eens nader bekijken wat realtime-evenementen betekenen in een digitaal bedrijf, en hoe het bouwen van een open architectuur om het meeste te halen uit de gegevens die deze evenementen genereren, een betere klantervaring kan creëren en inkomsten kan genereren.
Alle interacties zijn digitale interacties
Het is handig om eerst na te denken over wat een evenement is. In een zakelijke context wordt dit gedefinieerd als een interactie. Interacties met klanten, partners, leveranciers – uw hele waardeketen – zijn de drijvende krachten achter uw bedrijf.
Voor een digitaal getransformeerd bedrijf worden alle interacties digitaal bemiddeld. Dit geldt zelfs wanneer een interactie offline plaatsvindt, in de fysieke wereld. Denk aan een koeriersbedrijf dat een pakket aflevert, of een vliegtuig dat 30 minuten achter op schema landt: dit zijn digitaal bemiddelde offline activiteiten.
Deze interacties worden in technologische zin weergegeven als ‘gebeurtenissen’, waaraan een zeker belang wordt toegekend wanneer ze gebeuren. We kunnen in de semantiek van de softwarewereld verwijzen naar digitaal gemedieerde bedrijfsactiviteiten als realtime gebeurtenissen.
Hoe beheren en profiteren bedrijven van realtime evenementen? Met een gebeurtenisgestuurde architectuur: een benadering van softwareprogrammering die is gebaseerd op het vastleggen, communiceren, verwerken en vasthouden van deze gebeurtenissen – muisklikken, sensoruitgangen en dergelijke. Alles in realtime natuurlijk.
Het verwerken van datastromen in het moment omvat het ondernemen van acties op een reeks data die voortkomen uit een systeem dat continu gebeurtenissen creëert. Wanneer een vliegtuig achter op schema landt, kan een breed scala aan realtime gegevens acties uitlokken: beschikbaarheid van de gate, locatie van brandstoftrucks, gemiste aansluitingen.
De mogelijkheid om een non-stop datastroom te doorzoeken en te herkennen dat er iets belangrijks is gebeurd of afwijkingen te vinden, en er snel en op een zinvolle manier op te reageren (zoals het boeken van een nieuwe vlucht voor een passagier die zijn of haar aansluiting heeft gemist), vereist een specifieke technologie stapel.
De basis van een gebeurtenisgestuurde architectuur
Veel organisaties begrijpen het belang van gebeurtenisgestuurde architecturen. Vrijwel elk aspect van ons technologische leven is beïnvloed door de verschuiving naar gebeurtenisgestuurde, realtime gegevensverwerking – de manier waarop we communiceren, de manier waarop we werken, de manier waarop we eten bestellen. De manier waarop bedrijven worden geleid, is ook geëvolueerd: de beschikbaarheid van realtime voorraad-, verkoop- en vraaggegevens stimuleert realtime optimalisatie van supply chains in verschillende sectoren.
Terugkerend naar het voorbeeld van het pakketbezorgbedrijf: elke interactie – een chauffeur die een pakket scant, een gebruiker die naar een mobiele app kijkt, een verloren pakket – is een operationele gebeurtenis waar een software-engineer over moet nadenken.
Het is geen verrassing dat het op gebeurtenissen gebaseerde paradigma een grote impact heeft gehad op hoe de huidige software-architecturen eruitzien. Organisaties hebben een stapel technologieën nodig die realtime gegevens – of het nu ‘in beweging’ is en streamt vanaf IoT-apparaten of binnen een enterprise data-ecosysteem, of ‘in rust’ en vastgelegd in een database – beschikbaar maken voor gebruik in het moment.
Er zijn enkele kerncomponenten van een realtime datastack. Ze moeten de mogelijkheid hebben om snel uit te schalen en een elastische datastore die in staat is om data op te nemen en te distribueren terwijl deze binnenstromen. doorvoer en schaalbaarheid en het vermogen om gegevens zeer snel op te nemen en te verspreiden.
Hoogwaardige streamingtechnologie, zoals Apache Kafka of Apache Pulsar, is een ander belangrijk onderdeel van een gebeurtenisgestuurde architectuur. Moderne data-apps vereisen streamingtechnologieën die de reactieve betrokkenheid op het interactiepunt kunnen leveren die eindgebruikers gewend zijn.
De open data-stack
Bij DataStax was het ons doel om een open datastack te bouwen waarmee ondernemingen realtime data kunnen mobiliseren om grootschalige data-apps te bouwen, maar het is ook een fundamentele, geïntegreerde reeks technologieën die kan worden geïntegreerd met tal van andere producten en toolsets (inclusief analyseplatforms).
Drie belangrijke componenten vormen de stack die we aanbieden: Astra DB, een database-as-a-service gebouwd op Cassandra; Astra Streaming, gebouwd op de geavanceerde streamingtechnologie van open source Pulsar; en Change Data Capture (CDC) voor Astra DB, waarmee realtime operationele gegevens kunnen worden gestreamd via het gegevensecosysteem van een organisatie.
Een belangrijk onderdeel van onze stapel is het woord “open” – en dit brengt ons terug bij de analyse-discussie. Veel bedrijven merken dat er een impedantie-mismatch is tussen softwaresystemen die niet op gebeurtenissen zijn gebaseerd en het soort realtime analyse dat de meest waardevolle inzichten oplevert. Bedrijven moeten worstelen met verouderde gegevens die alleen een weergave kunnen vertegenwoordigen die uren of zelfs dagen oud is. Naarmate de vraag naar actuele nauwkeurigheid omhoog schiet om slimmere, onmiddellijke beslissingen en klantervaringen te stimuleren, wordt de noodzaak om deze verkeerde afstemming te corrigeren steeds urgenter.
Met een open, realtime datastack verdwijnt niet alleen dat probleem met de impedantie-mismatch, maar staan organisaties open om hun platform te integreren en hun data te verbinden met een willekeurig aantal andere technologieën, platforms en toolsets – inclusief realtime analyses en datastores zoals Flink, Apache Pinot en Apache Druid om er maar een paar te noemen.
Flexibiliteit is ingebouwd met een open datastack. Stel dat het data science-team van een organisatie een specifieke zakelijke vraag moet stellen (een ‘ad-hocquery’ in het analytische taalgebruik) van de operationele datastore – een vraag die niet wordt beantwoord door vooraf gedefinieerde of vooraf bepaalde datasets. Ad-hocquery’s zijn vaak moeilijk op te lossen, vooral bij grote datasets.
Maar wanneer een stapel wordt gebouwd met openheid en realtime gegevens die worden aangedreven door gebeurtenissen in het achterhoofd, wordt het relatief eenvoudig om gegevens van een operationele backend naar elk soort gegevensanalyseplatform te pipen. In het geval van het aanbod van DataStax heeft onze recente introductie van CDC voor Astra DB ons in wezen in staat gesteld om een high-throughput, scale-out streaming-mogelijkheid in de database in te bedden. Dit vereenvoudigt drastisch de mogelijkheid om alle gegevens, met milliseconden-responstijden, van een operationele backend (in ons geval Cassandra) naar Snowflake of AWS Athena te sturen. Het maakt het ook veel gemakkelijker om gegevens die zijn gegenereerd door analytische systemen naar edge-datastores te verplaatsen om de applicatieprestaties te verbeteren.
In wezen hoeft een applicatieontwikkelaar zich geen zorgen te maken dat de database die ze hebben gekozen om realtime gebruikersinteracties mogelijk te maken, de soorten analyses zal belemmeren die nodig zijn om het bedrijf vooruit te helpen.
Voldoen aan nieuwe verwachtingen
Realtime analyse is slechts één voorbeeld van het soort krachtige tools dat een onderneming binnen handbereik heeft wanneer het een architectuur bouwt die volledig kan profiteren van de gegevens die door zakelijke evenementen worden gegenereerd. Een op gebeurtenissen gebaseerde, realtime data-architectuur is precies hoe bedrijven tegenwoordig de ervaringen creëren die consumenten verwachten.
Meer informatie over DataStax Astra Streaming, dat nu algemeen beschikbaar is
Over Ed Anuff:
Ed is Chief Product Officer bij DataStax. Hij heeft meer dan 25 jaar ervaring als product- en technologieleider bij bedrijven als Google, Apigee, Six Apart, Vignette, Epicentric en Wired.