Evelyn_Johnson_600x448.jpg

Maak deze zes Big Data-fouten niet

Klik voor meer informatie over auteur Evelyn Johnson.

Waarom mislukken big data-projecten?

Zij doen; dat is zeker.

Gartner schatte dat 60 procent van de big data-projecten de gewenste doelstellingen niet haalt. Een jaar later hebben ze dit cijfer bijgesteld tot 85 procent, waarbij ze toegaven dat ze “te conservatief” waren met de oorspronkelijke schatting.

Dus om terug te gaan naar de oorspronkelijke vraag: wat is de reden dat zoveel big data-projecten niet succesvol zijn?

Welnu, er is een combinatie van redenen. Meestal is technologie niet eens de belangrijkste boosdoener.

Laat het me uitleggen.

Fouten die van big data een grote mislukking kunnen maken

Niet om clichématig te zijn, maar big data verandert de moderne wereld. Zijn vingerafdrukken zijn in elke sector, uit de detailhandel naar de gezondheidszorg en daarbuiten.

De term “too big to fail” krijgt een geheel nieuwe betekenis wanneer hij wordt toegepast op big data.

De omvang van dergelijke projecten overweldigt organisaties vaak tot het punt dat ze deze initiatieven helemaal vermijden. Het verliezen van investeringen in Data Science-projecten kan bedrijven een grote slag toebrengen.

Maar niet alle big data-projecten zijn gelijk gemaakt en zijn gedoemd te mislukken. Als u de volgende fouten vermijdt, kan big data uw grootste troef worden.

1. Focus op kortetermijnwinst

Onze jaartelling wordt niet voor niets het informatietijdperk genoemd. Elke belangrijke beslissing, of deze nu van een overheidsinstelling of een zakelijke entiteit is, moet worden ondersteund door relevante en authentieke gegevens. Voorbij zijn de dagen dat intuïtie en persoonlijke ervaring de besluitvorming bepaalden.

Bedrijven erkennen nu dat de gegevens die van klanten worden verzameld een enorme waarde hebben. Het is een troef die effectief moet worden beheerd. Dit kan gebeuren door technologie te gebruiken om het verzamelen van gegevens te vereenvoudigen, door automatisch te schalen voor het beheren van variabele gegevensvolumes en door AI in te schakelen, terwijl er wat ruimte overblijft voor aanpassing.

Wat de meeste bedrijven neigen te doen, is zich concentreren op de kortetermijnwaarde van deze tools en alles negeren wat ze op de lange termijn zouden opleveren. Hierdoor lopen ze een aantal belangrijke voordelen mis.

2. Gebrek aan focus op visualisatie

Soms besteden datawetenschappers niet veel tijd aan het begrijpen van de gegevens via een groot aantal visualisatietechnieken. Deze tools kunnen een belangrijke rol spelen bij het helpen van bedrijven om snel inzicht te krijgen.

Passende visualisaties zijn belangrijk voor het modelleren van verkennende data-analyse, het volgen van deze analyse en het illustreren van het resultaat.

Zonder dit kunnen zelfs de beste machine learning-modellen uw big data-projecten niet redden.

De meeste datawetenschappers geven de voorkeur aan grafiekachtige beelden vanwege hun esthetische aantrekkingskracht in plaats van rekening te houden met de kenmerken van hun dataset en dienovereenkomstig te beslissen.

Bedrijven zouden datawetenschappers moeten inhuren die de doelen van visualisatie en de basisprincipes ervan realiseren.

3. Geen centrale autoriteit hebben

De nauwkeurigheid en kwaliteit van de gegevens is een terugkerend probleem bij veel bedrijven. Het maakt niet uit hoe “groot” de gegevens zijn, ze hebben geen zin als ze vol inconsistenties en duplicaties zitten.

Een manier om hoge standaarden voor gegevensverzameling te handhaven, is door hiervoor een centraal toezicht in te stellen. Op deze manier kunnen duplicaties, slechte invoer en onjuist kolommengebruik helemaal worden vermeden.

Stel dus een commissie in of geef deze rol aan een doorgewinterde professional. Deze autoriteit zou in ieder geval een mandaat moeten hebben om de gegevens schoon te houden en medewerkers op te leiden die er gebruik van zullen maken.

Datahygiëne verdient bijzondere aandacht, en organisaties moeten niet terugdeinzen om extra te investeren in zo’n kritieke functie.

4. Te “groot” gaan

Dit lijkt misschien een beetje ironisch, maar het is iets dat gezegd moet worden; big data hoeft niet altijd groot te zijn. Ja, het hele punt is om grote brokken datasets te onderzoeken om patronen bloot te leggen, inzichten te verkrijgen en uw toekomstige beslissingen daarop te baseren.

Het verzamelen van alles wat kan worden verzameld, kan echter zakelijke functies ingewikkelder maken. Wanneer irrelevante gegevens worden bewaard, ontstaat er wat bekend staat als gegevensverzadiging – een situatie waarin enorm veel gegevens worden opgeslagen en het bijna onmogelijk is om deze te ordenen en zinvolle inzichten te verkrijgen.

Het is dus belangrijk om vanaf het allereerste begin met een goed doordacht plan in te gaan. Uw datastrategie moet aansluiten bij de algemene bedrijfsdoelstellingen van uw bedrijf. Verzamel doelgerichte en strategische informatie, en het zal tot enkele nuttige ontdekkingen leiden.

Nogmaals, een centraal gezaghebbend orgaan zou de taak moeten krijgen om te zorgen voor redundantie bij het verzamelen van gegevens en om de belangrijkste doelen en gerelateerde datasets te helpen identificeren.

5. Op zoek naar antwoorden zonder een vraag

Om David Copperfield te citeren: “We leven in de wereld die onze vragen creëren.” Weten welke vragen u beantwoord wilt hebben, is een essentieel onderdeel van Data Science. Het is de eerste stap waarna men de juiste datasets verzamelt en vervolgens resultaten verzamelt.

Zonder vragen over de data springen, maakt plaats voor analyseresultaten die weinig waarde hebben. Een betere benadering is om duidelijke doelstellingen en vragen te hebben, samen met enkele hypothesen om deze doelstellingen te bereiken.

Als u niet weet wat u wilt, wees dan bereid om niets te ontvangen. Big data stelt u in staat om nieuwe antwoorden op oude en nieuwe vragen te zoeken. Al deze antwoorden worden verkregen door datasets samen te voegen die nog nooit eerder zijn samengevoegd. Nieuwsgierigheid is de belangrijkste drijfveer in het hele proces.

6. Big data in dezelfde infrastructuur passen

Big data heeft zijn eigen vereisten, waaronder verschillende mechanismen voor authenticatie, gegevensisolatie, toegang tot en beheer van omgevingen in vergelijking met conventionele organisatiefuncties.

Simpel gezegd, organisatorische procedures moeten veranderen om big data te laten werken. Toevoegen aan een bestaande omgeving is slechts een recept voor teleurstelling.

De operationele processen zullen moeten worden aangepast om big data te laten werken. Anders krijgt uw bedrijf een uiterst complexe en inefficiënte architectuur.

Succes wordt behaald wanneer u een holistische blik werpt op wat uw organisatie nodig heeft, het hele bedrijf erbij betrekt en het plan in fasen uitvoert.

Dit alles moet gebeuren terwijl u op weg bent naar een referentie-infrastructuur, die werd gebouwd in de oorspronkelijke strategie.

Hoewel verandering inderdaad moeilijk is, is het noodzakelijk tijdens de implementatie van big data.

Gevolgtrekking

Verschillende technologieën zijn bedrijven helpen geld te besparen en het openen van nieuwe inkomstendeuren. Samen met kunstmatige intelligentie (AI), het internet der dingen (IoT) en virtual reality (VR) is Data Science naar voren gekomen als een technologie die de manier waarop bedrijven opereren volledig verandert.

Big data helpt besluitvormers trends uit het verleden te begrijpen en hen toe te rusten om in de toekomst betere beslissingen te nemen. Het is echter geen goocheltruc die alle beslissingsproblemen kan oplossen.

Om het een aanwinst voor uw organisatie te maken, moeten big data worden behandeld als een tool, samen met de juiste context en relevante businesscases.

Aangezien gegevens u helpen trends uit het verleden te begrijpen voor toekomstig gebruik, is het alleen maar passend dat u de veelvoorkomende fouten bij de implementatie van big data begrijpt voordat u doorgaat met het project.