Digitale transformatie, gedeeltelijk versneld door de COVID-19-pandemie, heeft de afgelopen twee jaar geleid tot een snelle acceptatie van cloud-native technologieën zoals microservices en Kubernetes.
Deze moderne applicatiearchitecturen bieden grote voordelen voor organisaties in termen van snellere innovatie, grotere flexibiliteit en verbeterde betrouwbaarheid.
Maar veel IT-teams staan nu onder enorme druk als ze proberen de beschikbaarheid en prestaties van enorm complexe cloud-native applicatie-architecturen te bewaken en te beheren. Ze worstelen om inzicht te krijgen in applicaties en onderliggende infrastructuur voor grote, beheerde Kubernetes-omgevingen die op openbare clouds draaien.
Zonder twijfel is het veel uitdagender om op de hoogte te blijven van beschikbaarheid en prestaties in een softwaregedefinieerde cloudomgeving, waar alles constant in realtime verandert. Maar digitale transformatieprojecten en innovatie-initiatieven blijven in een razend tempo draaien, technologen moeten zich aanpassen en de zichtbaarheid en het inzicht krijgen die ze nodig hebben in deze moderne omgevingen.
Een kwestie van schaal
Traditionele benaderingen van beschikbaarheid en prestaties waren vaak gebaseerd op fysieke infrastructuur. Flash back 10 jaar, en IT-afdelingen hadden een vast aantal servers en netwerkdraden – ze hadden te maken met constanten en vaste dashboards voor elke laag van de IT-stack. De introductie van cloud computing voegde een nieuw niveau van complexiteit toe, organisaties merkten dat ze hun gebruik van IT voortdurend op- en afschaalden, op basis van realtime bedrijfsbehoeften.
Hoewel monitoringoplossingen zijn aangepast om de toenemende implementatie van de cloud naast traditionele on-premise omgevingen mogelijk te maken, is de realiteit dat de meeste niet zijn ontworpen om efficiënt om te gaan met de dynamische en zeer vluchtige cloud-native omgevingen die we tegenwoordig steeds vaker zien.
Het is een kwestie van schaal… deze sterk gedistribueerde systemen zijn afhankelijk van duizenden containers en brengen elke seconde een enorm volume aan metrische gegevens, gebeurtenissen, logs en sporen (MELT) telemetrie voort. En momenteel hebben de meeste technologen gewoon geen manier om door dit verlammende datavolume en lawaai heen te komen bij het oplossen van applicatiebeschikbaarheid en prestatieproblemen die worden veroorzaakt door infrastructuurgerelateerde problemen die zich uitstrekken over hybride omgevingen.
Introductie van cloud-native observeerbaarheid
Daarom is het nu zo essentieel voor technologen om een cloud-native observeerbaarheidsoplossing te implementeren, om waarneembaarheid te bieden in zeer dynamische en complexe cloud-native applicaties en technologiestack.
Om ervoor te zorgen dat technologen goed kunnen begrijpen hoe hun applicaties zich gedragen, hebben ze inzicht nodig op het applicatieniveau, in de ondersteunende digitale services (zoals Kubernetes) en in de onderliggende infrastructure-as-code (IaC) services (zoals computer, server, database en netwerk) die ze gebruiken van hun cloudproviders.
Maar voordat technologen zich haasten om een oplossing voor deze groeiende uitdaging te implementeren, zijn er enkele belangrijke factoren waarmee technologen rekening moeten houden bij het nadenken over waarneembaarheid in cloudomgevingen:
Ten eerste moeten technologen op zoek zijn naar een speciaal gebouwde oplossing die gedistribueerde en dynamische cloud-native applicaties kan observeren. Traditionele monitoringoplossingen blijven een cruciale rol spelen – en zullen dat nog jaren blijven doen – maar het wordt problematisch wanneer cloudfunctionaliteit wordt vastgebout aan bestaande monitoring- en APM-oplossingen. Te vaak, wanneer nieuwe use-cases worden toegevoegd aan bestaande oplossingen, blijven gegevens losgekoppeld en in silo’s, waardoor gebruikers gedwongen worden van tabblad naar tabblad te springen om te proberen de hoofdoorzaken van prestatieproblemen te identificeren. Zeer weinig van deze oplossingen bieden volledig inzicht, bijvoorbeeld inzicht in bedrijfsstatistieken of beveiligingsprestaties, en veel zijn van nature bevooroordeeld naar een bepaalde laag van de IT-stack, afhankelijk van hun legacy, of dat nu de applicatie of de kerninfrastructuur is.
Nieuwe teams vragen om een nieuwe aanpak
Cloud-native applicaties worden op totaal verschillende manieren gebouwd en worden beheerd door nieuwe teams – Site Reliability Engineers (SRE), DevOps en CloudOps – met nieuwe vaardigheden, mindsets en manieren van werken. Daarom vragen ze om een heel ander soort technologie om beschikbaarheids- en prestatiegegevens bij te houden en te analyseren. Ze hebben een oplossing nodig die echt is aangepast aan de behoeften van de cloud-native technologiestack om kortstondige microservice-interacties met elkaar te ontcijferen en die al lang voorbij kan zijn als de probleemoplossing eenmaal is voltooid.
SRE- en DevOps-teams hebben een oplossing nodig die open standaarden omarmt en een volledig gecorreleerd beeld geeft van alle telemetriegegevens in de technologiestack, met name Open Telemetry. Technologen moeten in staat zijn om alle telemetriegegevens over de stack en domeinen te verzamelen en vervolgens al die telemetriegegevens – aangezien ze onderling verbonden en onderling afhankelijk zijn – in één keer analyseren. Een op standaarden gebaseerde oplossing is essentieel voor toekomstbestendige organisaties voor het komende decennium en daarna.
Technologen hebben ook een oplossing nodig waarmee ze de status van belangrijke zakelijke transacties die over hun technologielandschap zijn verspreid, kunnen bewaken. Als er een probleem wordt gedetecteerd, moeten ze de draad van de telemetriegegevens van de zakelijke transactie volgen, zodat ze snel de hoofdoorzaak van problemen kunnen bepalen, met isolatie van het foutdomein, en het probleem doorverwijzen naar de juiste teams voor een snelle oplossing.
Ten slotte moeten technologen op zoek naar een oplossing die waarneembaarheid combineert met geavanceerde AIOps-functionaliteit. Ze moeten de kracht van AIOps en business intelligence benutten om prioriteit te geven aan acties voor hun cloudomgevingen. In de toekomst zullen organisaties AI-ondersteunde probleemdetectie en -diagnose gebruiken met inzichten voor snellere probleemoplossing. Uiteindelijk kunnen technologen zich hierdoor sneller concentreren op wat er echt toe doet, waar en waarom het is gebeurd.
De applicatiewereld is de afgelopen twee jaar enorm geëvolueerd en technologen moeten ervoor zorgen dat hun monitoringmogelijkheden gelijke tred houden. Van het begrijpen hoe sterk gedistribueerde cloud-native applicaties werken en het voorspellen van incidenten tot het toepassen van nieuwe manieren om enorme hoeveelheden MELT-telemetriegegevens te verzamelen, teams in IT Ops, DevOps, CloudOps en SRE’s hebben contextuele inzichten nodig die zakelijke context diep in de technologie bieden stapel.
Alleen met de juiste cloud-native observeerbaarheidsoplossing kunnen organisaties de voordelen van moderne applicaties maximaliseren, verbeterde digitale ervaringen voor klanten en betere bedrijfsresultaten stimuleren.