Data Fabric-gebruiksscenario’s – DATAVERSITY

Gegevens nemen toe in volume, variëteit en bronnen; Daarom is er ook behoefte aan betrouwbare, nauwkeurige en tijdige gegevens voor on-demand ‘competitieve informatie’. EEN data fabric biedt een technologische oplossing voor de lange termijn voor het omgaan met de talloze uitdagingen die gepaard gaan met zo’n complex data-ecosysteem. Dit “geconvergeerde platform”, ontworpen met een unieke architectuur en een bundel datadiensten, is goed uitgerust om te voorzien in de diverse behoeften op het gebied van databeheer van een complex data-ecosysteem.

Volgens Allied Market Researchwordt verwacht dat de Data Fabric Market tegen 2026 $ 4.546,9 miljoen zal bedragen. Het rapport Data Fabric-markt per implementatie, type, bedrijfsgrootte en brancheverticaal: wereldwijde kansenanalyse en brancheprognose, 2019-2026 bevestigt dat de datafabric-markt naar verwachting zal groeien met een CAGR van 23,8 procent tussen 2019 en 2026, met als hoogtepunt $ 4.546,9 miljoen in 2026. Tijdens deze geprojecteerde periode wordt verwacht dat de Noord-Amerikaanse datafabric-markt ‘dominant zal blijven’, aangezien de cloud de markt van serviceproviders, de grootste gebruiker van datafabric-oplossingen, zal in dezelfde periode ook aanzienlijk stijgen.

The Data Fabric: een innovatieve oplossing voor gegevensbeheer legt uit dat een datafabriek platformtools biedt voor risicobeoordeling, grote opslag voor gegevens van meerdere typen, toegang tot gegevens uit meerdere bronnen en één gegevensweergave voor de hele onderneming.

Wat is precies een datafabriek?

Een datafabric, een van Gartner’s Top 10 trends in gegevensanalyse, is gedefinieerd als:

“Een op maat gemaakt ontwerp dat herbruikbare dataservices, pijplijnen, semantische lagen of API’s biedt via een combinatie van data-integratiebenaderingen op een georkestreerde manier.”

In het digitale tijdperk vereisen meerdere klantcontactpunten een soepele informatiestroom voor realtime analyses en onmiddellijke besluitvorming. Een technologisch raamwerk zoals een datafabriek biedt een naadloos analyseproces over verschillende datapijplijnen en serviceplatforms.

In een tijdperk waarin betrouwbare opslagfaciliteiten cruciaal zijn voor het succes van enterprise Data Management, lijkt de ‘opnieuw ontworpen opslag’ van een datafabriek, met voldoende beveiliging, schaalbaarheid, replicatie-opties en hoogwaardige kenmerken, perfect te passen bij de cloudinfrastructuur-as-a-service (IaaS) -platform. In Wat zijn enkele van de verschillende componenten van een Enterprise Data Fabric?, Senior Director of Product Marketing bij Datameer John Morrell vertelt over zijn videoserie over veel belangrijke datatechnologische onderwerpen, waaronder de datafabric.

Een recente diavoorstelling beschikt over 15 vooraanstaande leveranciers die een big data fabric aanbieden. Een big data fabric als een opkomend platform dat zakelijke inzichten versnelt “door opname, beheer, ontdekking, voorbereiding en integratie vanuit datasilo’s te automatiseren.” verder Een big data fabric ondersteunt “vele soorten gebruiksscenario’s, waaronder realtime inzichten, machine learning, streaminganalyses en geavanceerde analyses.”

Gebruiksscenario’s voor Big Data Fabric voor geavanceerde analyses

Bij typische big data-projecten is de grootste uitdaging het grote volume en de complexiteit van de gegevens die voor analyse worden gebruikt. De behendigheid en flexibiliteit van een datafabric-infrastructuur maakt snelle toegang tot de juiste gegevens op het juiste moment mogelijk voor verbeterde analyse.

Zoals recente gevallen van big data-gebruik zonder twijfel hebben bevestigd, was de big data-fabric de game-changer, zoals uitgelegd in Big Data Fabric: een noodzaak voor elk succesvol Big Data-initiatief. Het big data fabric-platform biedt end-to-end-beveiliging in combinatie met ondersteunde gegevens integratie en zelfbedieningsanalysemogelijkheden voor de gemiddelde zakelijke gebruiker. Het artikel bespreekt ook een andere gerelateerde technologie – datavirtualisatie, wat van onschatbare waarde is voor:

  • Toegang tot een breed scala aan gegevens
  • Big data-analyse uitvoeren zonder technische vaardigheden
  • Verschillende use-cases verkennen

Volgens Forrester, big data fabric is:

“Een uniforme, vertrouwde en uitgebreide weergave van bedrijfsgegevens die worden geproduceerd door gegevensbronnen automatisch, intelligent en veilig te orkestreren en ze vervolgens voor te bereiden en te verwerken in big data-platforms zoals Hadoop en Apache Spark, data meren, in-memory en NoSQL. “

Data Fabric-gebruiksscenario’s voor zakelijke toepassingen

Moderne bedrijven floreren op de rand, dus moeten ze technologiegestuurde oplossingen in realtime benutten voor een reeks gebruiksscenario’s. Dergelijke use-cases kunnen zijn:

  • Preventieve onderhoudsanalyses uitvoeren om stilstand te voorkomen
  • Klantensentimenten opvolgen om churn te voorspellen
  • Monitoring van de markten om fraude op te sporen
  • Geavanceerde voorspellende en prescriptieve analyses uitvoeren om producten of processen te optimaliseren

Hoewel deze use-cases vrij gebruikelijk zijn binnen een bedrijf van elke omvang, zijn de technologische middelen en modi om oplossingen te bieden niet overal in het zakelijke landschap hetzelfde. De bedrijven die zichzelf als “datagedreven” beschouwen en al geavanceerde datatechnologiesystemen hebben geïmplementeerd, zullen waarschijnlijk sneller slagen dan hun concurrenten.

EEN data fabric kan het verschil betekenen tussen succes en mislukking voor een dergelijk bedrijf, aangezien dit unieke ecosysteem voor gegevensbeheer tal van voordelen biedt, bijvoorbeeld flexibiliteit, schaalbaarheid, beveiliging, realtime analyse en geavanceerde analysemogelijkheden – allemaal op één plek. Dit Cloudera blogpost verzekert dat big data fabric het hoofd biedt aan “de uitdagingen van onvoldoende beschikbaarheid van gegevens, onbetrouwbaarheid van gegevensopslag en -beveiliging, geïsoleerde gegevens, slechte schaalbaarheid en afhankelijkheid van ondermaats presterende legacy-systemen.”

Gegevensdemocratisering en de gegevensstructuur heeft het over de “interoperabiliteit” van gegevens uit meerdere bronnen in een gegevensstructuur, in zekere zin, wat duidt op de democratisering van gegevens. De auteur legt uit hoe dit raamwerk datamanagementtaken vereenvoudigt in de cloud en on-premise databronnen.

De MapR-gegevensbeheer platform, bijvoorbeeld, bindt “realtime, dode en batch” -gegevens samen voor collectieve analyse. De MapR-datafabric stelt de gebruiker in staat om toegang te verlenen tot zowel bestaande applicaties of tools als nieuwe tools zoals Apache Drill. Dit platform biedt toegang tot “gegevens in alle vormen” op “alle locaties”. Het basisdoel van MapR-datafabric is het afbreken van datasilo’s voor just-in-time toegang tot alle soorten data, zoals uitgelegd in De moderne gegevensstructuur Wat het voor uw bedrijf betekent.

De Talend Data Fabric Solutions helpt IT-teams om te schakelen tussen projecten zonder enige leercurve. Dit platform combineert tools voor data-integratie, cloud, Master Data Management (MDM), Data Quality (DQ) en data-integratietools op één “enkel platform met een gemeenschappelijke ontwikkel- en beheeromgeving.” Het uiteindelijke doel is een hogere productiviteit.

Data Fabric Use Case voor Machine Learning

Machine learning (ML) -modellen kunnen efficiënt worden gebruikt in een datafabric-omgeving omdat data voorbereiding tijd wordt geminimaliseerd terwijl de bruikbaarheid van de voorbereide gegevens toeneemt tussen modellen en toepassingen. Wanneer gegevens over een onderneming worden gedistribueerd – in de cloud, on-premise en aan de rand (IoT) – biedt datafabric ‘gecontroleerde toegang’ tot beveiligde gegevens, wat verbeterde ML-processen mogelijk maakt. De leermogelijkheden van ML-modellen worden aanzienlijk verbeterd wanneer de juiste gegevens op het juiste moment aan hen worden toegevoerd.

Over het algemeen kunnen voor één use case een aantal modellen worden gebruikt. In een typisch scenario voor bedrijfsanalyses kan datafabriek de uitdagingen van gedistribueerde gegevensstapels en tijdrovende ML-processen effectief aanpakken.

Een andere interessante use case voor data fabric is ‘data in beweging’, die in rustmodus moet worden geraadpleegd en geanalyseerd. Succesvolle machine learning met een wereldwijde datafabric wijst erop dat door gegevens te beheren, te controleren en te distribueren naar datawetenschappers voor geavanceerde analyses, helpen datafabric-platforms hen zich te concentreren op de data-analysefase in plaats van tijd te verspillen aan datavoorbereiding.

Volgens KD Nugget:

“Reproduceerbaarheid is belangrijk voor datawetenschap en natuurlijk voor machine learning, dus we hebben een gemakkelijke manier nodig om geharmoniseerde gestructureerde en ongestructureerde data te hergebruiken door catalogi van datasets te beheren.”

De KDNugget-tutorial over data fabric voor ML leert hoe een graph-database en een semantische datalaag samen alle databronnen in een datafabric-omgeving ‘integreert en harmoniseert’.

Data Fabric Use Case voor Data Discovery

Gegevensdetectie is een zeer belangrijke laag van het bedrijfsanalyseproces, aangezien deze laag de toegang tot de juiste gegevens regelt. Wanneer bedrijven zowel datavirtualisatie- als datafabric-platforms samen gebruiken, behalen ze aanzienlijke voordelen in bedrijfsanalyses. De gegevensdetectielaag ontvouwt welke gegevens beschikbaar zijn voor gebruik, wat lijkt op de “laad” -functie van traditionele ETL-tools. Wat het datafabric-framework zo krachtig maakt, is de laatste datamanagementlaag, die door alle andere lagen loopt en de beveiliging, datagovernance en MDM beheert.

Afbeelding gebruikt onder licentie van Shutterstock.com

follow:
admin

admin

Related Posts