Wat is data-analyse?
Data-analyse is een discipline die zich richt op het extraheren van inzichten uit data. Het omvat de processen, hulpmiddelen en technieken voor gegevensanalyse en -beheer, inclusief het verzamelen, ordenen en opslaan van gegevens. Het belangrijkste doel van data-analyse is om statistische analyse en technologieën op data toe te passen om trends te vinden en problemen op te lossen. Data-analyse is in de onderneming steeds belangrijker geworden als middel voor het analyseren en vormgeven van bedrijfsprocessen en het verbeteren van besluitvorming en bedrijfsresultaten.
Gegevensanalyse put uit een reeks disciplines – waaronder computerprogrammering, wiskunde en statistiek – om analyses op gegevens uit te voeren in een poging om de prestaties te beschrijven, voorspellen en verbeteren. Om een robuuste analyse te garanderen, maken data-analyseteams gebruik van een reeks technieken voor gegevensbeheer, waaronder datamining, gegevensopschoning, gegevenstransformatie, gegevensmodellering en meer.
Wat zijn de vier soorten data-analyse?
Analytics valt grofweg uiteen in vier typen: beschrijvende analyses, die proberen te beschrijven wat er op een bepaald moment is gebeurd; diagnostische analyse, die beoordeelt waarom iets is gebeurd; voorspellende analyses, die de waarschijnlijkheid bepalen dat er iets in de toekomst gebeurt; en prescriptieve analyses, die aanbevolen acties bieden om een gewenst resultaat te bereiken.
Specifieker:
Beschrijvende analyses gebruikt historische en actuele gegevens uit meerdere bronnen om de huidige staat of een bepaalde historische staat te beschrijven door trends en patronen te identificeren. In business analytics is dit het domein van business intelligence (BI).
Diagnostische analyses gebruikt gegevens (vaak gegenereerd via beschrijvende analyses) om de factoren of redenen voor prestaties in het verleden te ontdekken.
Voorspellende analyse past technieken zoals statistische modellering, prognoses en machine learning toe op de output van beschrijvende en diagnostische analyses om voorspellingen te doen over toekomstige resultaten. Voorspellende analyses worden vaak beschouwd als een soort ‘geavanceerde analyse’ en zijn vaak afhankelijk van machine learning en/of deep learning.
Prescriptieve analyses is een soort geavanceerde analyse waarbij tests en andere technieken worden toegepast om specifieke oplossingen aan te bevelen die de gewenste resultaten opleveren. In het bedrijfsleven maken voorspellende analyses gebruik van machine learning, bedrijfsregels en algoritmen.
Methoden en technieken voor gegevensanalyse
Data-analisten gebruiken een aantal methoden en technieken om gegevens te analyseren. Volgens Emily Stevens, hoofdredacteur bij CareerFoundry, zijn zeven van de meest populaire:
- Regressie analyse: Regressieanalyse is een reeks statistische processen die worden gebruikt om de relaties tussen variabelen te schatten om te bepalen hoe wijzigingen in een of meer variabelen een andere kunnen beïnvloeden. Hoe kunnen uitgaven voor sociale media bijvoorbeeld de verkoop beïnvloeden?
- Monte Carlo simulatie: Volgens Investopedia worden “Monte Carlo-simulaties gebruikt om de waarschijnlijkheid van verschillende uitkomsten te modelleren in een proces dat niet gemakkelijk kan worden voorspeld vanwege de tussenkomst van willekeurige variabelen.” Het wordt vaak gebruikt voor risicoanalyse.
- Factoren analyse: Factoranalyse is een statistische methode om een enorme dataset te nemen en deze terug te brengen tot een kleinere, beter beheersbare. Dit heeft als bijkomend voordeel dat het vaak verborgen patronen blootlegt. In een zakelijke omgeving wordt factoranalyse vaak gebruikt om zaken als klantloyaliteit te onderzoeken.
- Cohortanalyse: Cohortanalyse wordt gebruikt om een dataset op te splitsen in groepen die gemeenschappelijke kenmerken, of cohorten, delen voor analyse. Dit wordt vaak gebruikt om klantsegmenten te begrijpen.
- Clusteranalyse: StatisticsSolutions definieert clusteranalyse als “een klasse van technieken die worden gebruikt om objecten of gevallen te classificeren in relatieve groepen die clusters worden genoemd.” Het kan worden gebruikt om structuren in gegevens bloot te leggen – verzekeringsmaatschappijen kunnen clusteranalyse gebruiken om bijvoorbeeld te onderzoeken waarom bepaalde locaties worden geassocieerd met bepaalde verzekeringsclaims.
- Tijdreeksanalyse: StatisticsSolutions definieert tijdreeksanalyse als “een statistische techniek die zich bezighoudt met tijdreeksgegevens of trendanalyse. Tijdreeksgegevens betekent dat gegevens zich in een reeks van bepaalde tijdsperioden of intervallen bevinden.” Tijdreeksanalyse kan worden gebruikt om trends en cycli in de tijd te identificeren, bijvoorbeeld wekelijkse verkoopcijfers. Het wordt vaak gebruikt voor economische en verkoopprognoses.
- Sentiment analyse: Sentimentanalyse maakt gebruik van hulpmiddelen zoals natuurlijke taalverwerking, tekstanalyse, computerlinguïstiek, enzovoort, om de gevoelens die in de gegevens worden uitgedrukt te begrijpen. Terwijl de vorige zes methoden kwantitatieve gegevens (gegevens die kunnen worden gemeten) proberen te analyseren, probeert sentimentanalyse kwalitatieve gegevens te interpreteren en te classificeren door ze in thema’s te ordenen. Het wordt vaak gebruikt om te begrijpen hoe klanten over een merk, product of dienst denken.
Data-analisten en anderen die met analyse werken, gebruiken een reeks tools om hen te helpen in hun rol. De volgende zijn enkele van de meest populaire:
- Apache-vonk: Een open source data science-platform voor het verwerken van big data en het creëren van cluster computing-engines
- Excel: De spreadsheetsoftware van Microsoft is misschien wel de meest gebruikte analysetool, vooral voor wiskundige analyse en rapportage in tabelvorm
- Kijker: Google’s data-analyse en BI-platform
- Power-BI: Microsoft’s datavisualisatie- en analysetool voor het maken en verspreiden van rapporten en dashboards
- Python: Een open source programmeertaal waarmee gebruikers gegevens kunnen extraheren, samenvatten en visualiseren
- Qlik: Een reeks gegevensanalyse-, gegevensintegratie- en programmeerplatforms voor het verkennen van gegevens en het maken van gegevensvisualisaties
- QuickSight: Een BI- en analysecloudservice van Amazon ontworpen om te integreren met cloudgegevensbronnen
- R: Een open source data-analysetool voor statistische analyse en grafische modellering
- RapidMiner: Een data science-platform met een visuele workflow-ontwerper
- SAS: Een analyseplatform voor business intelligence en datamining
- sisense: Een populair selfservice business intelligence-platform
- Tableau: Software voor gegevensanalyse van Salesforce voor het maken van dashboards, kaarten en visualisaties van gegevens
- talent: Een platform voor het transformeren en laden van big data-bestanden dat wordt gebruikt door data-engineers, data-architecten, analisten en ontwikkelaars
Gegevensanalyse versus gegevenswetenschap
Data-analyse en datawetenschap zijn nauw met elkaar verbonden. Gegevensanalyse is een onderdeel van gegevenswetenschap en wordt gebruikt om te begrijpen hoe de gegevens van een organisatie eruitzien. Over het algemeen zijn de output van data-analyse rapporten en visualisaties. Datawetenschap gebruikt de output van analyses om problemen te bestuderen en op te lossen.
Het verschil tussen data-analyse en datawetenschap wordt vaak gezien als een van de tijdschaal. Data-analyse beschrijft de huidige of historische toestand van de werkelijkheid, terwijl datawetenschap die gegevens gebruikt om de toekomst te voorspellen en/of te begrijpen.
Gegevensanalyse versus gegevensanalyse
Hoewel de termen data-analyse en data-analyse vaak door elkaar worden gebruikt, is data-analyse een subset van data-analyse die zich bezighoudt met het onderzoeken, opschonen, transformeren en modelleren van data om conclusies te trekken. Gegevensanalyse omvat de tools en technieken die worden gebruikt om gegevensanalyse uit te voeren.
Gegevensanalyse versus bedrijfsanalyse
Bedrijfsanalyse is een andere subset van gegevensanalyse. Bedrijfsanalyse maakt gebruik van data-analysetechnieken, waaronder datamining, statistische analyse en voorspellende modellering, om betere zakelijke beslissingen te nemen. Gartner definieert bedrijfsanalyse als “oplossingen die worden gebruikt om analysemodellen en simulaties te bouwen om scenario’s te creëren, de realiteit te begrijpen en toekomstige toestanden te voorspellen.”
Voorbeelden van gegevensanalyse
Organisaties in alle sectoren maken gebruik van data-analyse om de bedrijfsvoering te verbeteren, de omzet te verhogen en digitale transformaties te vergemakkelijken. Hier zijn drie voorbeelden:
UPS levert veerkracht, flexibiliteit met voorspellende analyses: Multinationale verzendmaatschappij UPS heeft de Harmonized Enterprise Analytics Tool (HEAT) gemaakt om het te helpen klantgegevens, operationele gegevens en planningsgegevens vast te leggen en te analyseren om de realtime status van elk pakket te volgen terwijl het over zijn netwerk beweegt. De tool helpt het bij het bijhouden van de ongeveer 21 miljoen pakketten die het elke dag bezorgt.
Voorspellende analyses helpen Owens Corning bij het ontwikkelen van turbinebladen: Fabrikant Owens Corning heeft, met de hulp van zijn analysecentrum van uitmuntendheid, voorspellende analyses gebruikt om het proces van het testen van de bindmiddelen die worden gebruikt bij het maken van glasweefsels voor windturbinebladen te stroomlijnen. Analytics heeft het bedrijf geholpen de testtijd voor elk nieuw materiaal te verkorten van 10 dagen tot ongeveer twee uur.
Kaiser Permanente verkort wachttijden met analytics: Kaiser Permanente gebruikt sinds 2015 een combinatie van analyse, machine learning en AI om de gegevensactiviteiten van zijn 39 ziekenhuizen en meer dan 700 medische kantoren in de VS te herzien. betere patiëntenzorg te bieden en tegelijkertijd de efficiëntie van de dagelijkse operaties te verbeteren.
Salarissen voor data-analyse
Hier zijn enkele van de meest populaire functietitels met betrekking tot data-analyse en het gemiddelde salaris voor elke functie, volgens gegevens van PayScale.
- Analytics-manager: $ 71K- $ 131K
- Bedrijfsanalist: $ 47K- $ 84K
- Bedrijfsanalist, IT: $ 51K- $ 100K
- Business intelligence-analist: $ 52K- $ 97K
- Gegevensanalist: $ 45K- $ 87K
- Marktonderzoekanalist: $ 41K- $ 77K
- Operationeel onderzoeksanalist: $ 47K- $ 117K
- Kwantitatieve analist: $60K-$132K
- Senior bedrijfsanalist: $65K-$117K
- Statisticus: $ 55K- $ 118K