Wat is een datawetenschapper?
Datawetenschappers zijn analytische data-experts die datawetenschap gebruiken om inzichten te ontdekken uit enorme hoeveelheden gestructureerde en ongestructureerde data om te helpen bij het vormgeven of voldoen aan specifieke zakelijke behoeften en doelen. Datawetenschappers worden steeds belangrijker in het bedrijfsleven, aangezien organisaties steeds meer afhankelijk zijn van data-analyse om de besluitvorming te stimuleren en te steunen op automatisering en machine learning als kerncomponenten van hun IT-strategieën.
Functieomschrijving gegevenswetenschapper
Het hoofddoel van een datawetenschapper is het organiseren en analyseren van gegevens, vaak met behulp van software die speciaal voor de taak is ontworpen. De uiteindelijke resultaten van de analyse van een datawetenschapper moeten gemakkelijk genoeg zijn voor alle belanghebbenden om te begrijpen, vooral degenen die buiten de IT werken.
De benadering van data-analyse door een datawetenschapper hangt af van hun branche en de specifieke behoeften van het bedrijf of de afdeling waarvoor ze werken. Voordat een datawetenschapper betekenis kan vinden in gestructureerde of ongestructureerde data, moeten bedrijfsleiders en afdelingsmanagers communiceren waar ze naar op zoek zijn. Als zodanig moet een datawetenschapper over voldoende zakelijke domeinexpertise beschikken om bedrijfs- of afdelingsdoelen te vertalen in op gegevens gebaseerde resultaten zoals voorspellingsengines, patroondetectie-analyse, optimalisatie-algoritmen en dergelijke.
Voor meer informatie over functiebeschrijvingen van datawetenschappers vanuit een wervingsperspectief, zie “Functiebeschrijving datawetenschapper: tips voor het binnenhalen van toptalent.”
Datawetenschapper versus data-analist
Datawetenschappers werken vaak samen met data-analisten, maar hun rollen verschillen aanzienlijk. Datawetenschappers houden zich vaak bezig met langetermijnonderzoek en voorspellingen, terwijl data-analisten bedrijfsleiders willen ondersteunen bij het nemen van tactische beslissingen door middel van rapportage en ad-hocvragen die zijn gericht op het beschrijven van de huidige stand van zaken voor hun organisaties op basis van huidige en historische gegevens.
Het verschil tussen het werk van data-analisten en dat van datawetenschappers komt dus vaak neer op tijdschaal. Een data-analist kan een organisatie helpen beter te begrijpen hoe haar klanten haar product op dit moment gebruiken, terwijl een datawetenschapper inzichten die uit die data-analyse zijn gegenereerd, kan gebruiken om een nieuw product te ontwerpen dat inspeelt op toekomstige behoeften van de klant.
Salaris voor datawetenschapper
Datawetenschap is een snelgroeiend veld, waarbij de BLS een banengroei van 22% voorspelt van 2020 tot 2030. Datawetenschapper blijkt ook een bevredigend carrièrepad voor de lange termijn te zijn, met Glassdoor’s 50 beste banen in Amerika rangschikt datawetenschapper als de derde- beste baan in de VS.
Volgens gegevens uit Robert Half’s Technology and IT Salary Guide 2021, is het gemiddelde salaris voor datawetenschappers, op basis van ervaring, als volgt verdeeld:
- 25e percentiel: $ 109.000
- 50e percentiel: $ 129.000
- 75e percentiel: $ 156.500
- 95e percentiel: $ 185.750
Verantwoordelijkheden van datawetenschapper
De hoofdverantwoordelijkheid van een datawetenschapper is data-analyse, die begint met het verzamelen van gegevens en eindigt met zakelijke beslissingen op basis van analytische resultaten.
De gegevens die gegevenswetenschappers analyseren, zijn afkomstig uit vele bronnen, waaronder gestructureerde, ongestructureerde of semi-gestructureerde gegevens. Hoe meer gegevens van hoge kwaliteit beschikbaar zijn voor datawetenschappers, hoe meer parameters ze in een bepaald model kunnen opnemen en hoe meer gegevens ze bij de hand hebben voor het trainen van hun modellen.
Gestructureerde gegevens zijn geordend, meestal in categorieën, zodat computers gemakkelijk automatisch kunnen sorteren, lezen en ordenen. Dit omvat gegevens die zijn verzameld door services, producten en elektronische apparaten, maar zelden gegevens die zijn verzameld door menselijke input. Gegevens over websiteverkeer, verkoopcijfers, bankrekeningen of GPS-coördinaten die door uw smartphone zijn verzameld — dit zijn gestructureerde vormen van gegevens.
Ongestructureerde gegevens, de snelstgroeiende vorm van gegevens, zijn waarschijnlijker afkomstig van menselijke input – klantrecensies, e-mails, video’s, posts op sociale media, enz. Deze gegevens zijn moeilijker te doorzoeken en minder efficiënt te beheren met technologie, waardoor een grotere investering om te onderhouden en te analyseren. Bedrijven vertrouwen doorgaans op trefwoorden om ongestructureerde gegevens te begrijpen om relevante gegevens eruit te halen met behulp van doorzoekbare termen.
Semi-gestructureerde data valt tussen beide in. Het voldoet niet aan een gegevensmodel, maar heeft wel bijbehorende metagegevens die kunnen worden gebruikt om het te groeperen. Voorbeelden zijn e-mails, binaire uitvoerbare bestanden, gecomprimeerde bestanden, websites, enz.
Meestal hebben bedrijven datawetenschappers in dienst om ongestructureerde data en semi-gestructureerde data te verwerken, terwijl ander IT-personeel gestructureerde data beheert en onderhoudt. Ja, datawetenschappers hebben te maken met veel gestructureerde data, maar bedrijven proberen steeds vaker ongestructureerde data te gebruiken in dienst van het omzetdoel, waardoor benaderingen van ongestructureerde data essentieel zijn voor de rol van datawetenschapper.
Voor meer inzicht in het beroepsleven van datawetenschappers, zie “Wat doet een datawetenschapper? 7 van deze veelgevraagde professionals bieden hun inzichten aan.”
Vereisten voor gegevenswetenschappers
Elke branche heeft zijn eigen dataprofiel dat datawetenschappers kunnen analyseren. Hier zijn enkele veelvoorkomende vormen van analyse die datawetenschappers waarschijnlijk in verschillende industrieën zullen uitvoeren, volgens de BLS.
Bedrijf: Gegevensanalyse van bedrijfsgegevens kan leiden tot beslissingen over efficiëntie, voorraad, productiefouten, klantloyaliteit en meer.
E-commerce: Nu websites meer verzamelen dan alleen aankoopgegevens, helpen datawetenschappers e-commercebedrijven om de klantenservice te verbeteren, trends te ontdekken en diensten of producten te ontwikkelen.
Financiën: Gegevens over rekeningen, krediet- en debettransacties en soortgelijke financiële gegevens zijn essentieel voor een goed functionerend bedrijf. Maar voor datawetenschappers in de financiële sector zijn beveiliging en compliance, inclusief fraudedetectie, ook grote zorgen.
Regering: Big data helpt overheden bij het nemen van beslissingen, het ondersteunen van kiezers en het bewaken van de algehele tevredenheid. Net als in de financiële sector zijn beveiliging en compliance van het grootste belang voor datawetenschappers.
Wetenschap: Dankzij recente IT-ontwikkelingen kunnen wetenschappers tegenwoordig gegevens uit experimenten beter verzamelen, delen en analyseren. Datawetenschappers kunnen hierbij helpen.
Sociaal netwerken: Gegevens van sociale netwerken kunnen informatie verstrekken over gerichte advertenties, de klanttevredenheid verbeteren, trends in locatiegegevens vaststellen en functies en services verbeteren.
Gezondheidszorg: Elektronische medische dossiers vereisen toewijding aan big data, beveiliging en compliance. Hier kunnen datawetenschappers helpen de gezondheidsdiensten te verbeteren en trends te ontdekken die anders onopgemerkt zouden blijven.
Vaardigheden in datawetenschappers
Volgens William Chen, Data Science Manager bij Quora, bestaat de top vijf van vaardigheden voor datawetenschappers uit een mix van harde en zachte vaardigheden:
- Programmering: De ‘meest fundamentele vaardigheden van een datawetenschapper’, programmeren verbetert je statistische vaardigheden, helpt je ‘grote datasets te analyseren’ en geeft je de mogelijkheid om je eigen tools te maken, zegt Chen.
- Kwantitatieve analyse: Kwantitatieve analyse verbetert uw vermogen om experimentele analyses uit te voeren, uw gegevensstrategie te schalen en u te helpen machine learning te implementeren.
- Productintuïtie: Als u producten begrijpt, kunt u kwantitatieve analyses uitvoeren en systeemgedrag beter voorspellen, metrieken vaststellen en debuggingvaardigheden verbeteren.
- Communicatie: Misschien wel de belangrijkste soft skills in elke branche, sterke communicatieve vaardigheden zullen je helpen “alle eerder genoemde vaardigheden te benutten”, zegt Chen.
- Teamwerk: Net als communicatie is teamwerk essentieel voor een succesvolle carrière in de datawetenschap. Het vereist onbaatzuchtig zijn, feedback omarmen en kennis delen met je team, zegt Chen.
Ronald Van Loon, CEO van Intelligent World, voegt zakelijk inzicht toe aan de lijst. Van Loon zegt dat sterk zakelijk inzicht de beste manier is om de technische vaardigheden van een datawetenschapper te kanaliseren. Het is noodzakelijk om de problemen en potentiële uitdagingen te onderscheiden die moeten worden opgelost om een organisatie te laten groeien.
Zie “Essentiële vaardigheden en eigenschappen van elite datawetenschappers” voor een diepere kijk op wat er nodig is om uit te blinken als datawetenschapper.
Opleiding en training voor datawetenschappers
Er zijn tal van manieren om datawetenschapper te worden, maar de meest traditionele route is door het behalen van een bachelordiploma. De meeste datawetenschappers hebben een masterdiploma of hoger, volgens BLS-gegevens, maar niet elke datawetenschapper heeft dat, en er zijn andere manieren om datawetenschapsvaardigheden te ontwikkelen. Voordat je in een hoger onderwijsprogramma springt, wil je weten in welke branche je gaat werken om erachter te komen wat de belangrijkste vaardigheden, tools en software zijn.
Omdat datawetenschap enige expertise op het gebied van bedrijfsdomein vereist, verschilt de rol per branche, en als je in een zeer technische branche werkt, heb je mogelijk verdere training nodig. Als je bijvoorbeeld in de gezondheidszorg, de overheid of de wetenschap werkt, heb je andere vaardigheden nodig dan wanneer je in de marketing, het bedrijfsleven of het onderwijs werkt.
Als je bepaalde vaardigheden wilt ontwikkelen om aan specifieke behoeften van de branche te voldoen, zijn er online lessen, bootcamps en professionele ontwikkelingscursussen die je kunnen helpen je vaardigheden aan te scherpen. Voor degenen die een graduate school overwegen, zijn er een aantal hoogwaardige data science-masterprogramma’s, waaronder de volgende:
- Master of Science in de statistiek: datawetenschap aan de Stanford University
- Master of Information and Data Science: Berkeley School of Information
- Master in Computational Data Science: Carnegie Mellon University
- Master of Science in Data Science: Harvard University John A. Paulson School of Engineering and Applied Sciences
- Master of Science in datawetenschap: Universiteit van Washington
- Master of Science in Data Science: John Hopkins University Whiting School of Engineering
- MSc in Analytics: Universiteit van Chicago Graham School
Data science-certificeringen
Naast bootcamps en professionele ontwikkelingscursussen, zijn er tal van waardevolle big data-certificeringen en datawetenschapscertificeringen die uw cv en uw salaris een boost kunnen geven.
- Gecertificeerde Analytics Professional (CAP)
- Cloudera Data Platform Generalist-certificering
- Data Science Council of America (DASCA) Senior Data Scientist (SDS)
- Data Science Council of America (DASCA) Principal Data Scientist (PDS)
- IBM Data Science Professional-certificaat
- Microsoft gecertificeerd: Azure AI Fundamentals
- Microsoft gecertificeerd: Azure Data Scientist Associate
- Open Certified Data Scientist (Open CDS)
- SAS-gecertificeerde AI- en machine learning-professional
- SAS Certified Advanced Analytics Professional met SAS 9
- SAS gecertificeerd datawetenschapper
- Tensorflow-ontwikkelaarscertificaat
Andere banen in datawetenschap
Datawetenschapper is slechts één functietitel in het groeiende veld van datawetenschap, en niet elk bedrijf dat gebruik maakt van datawetenschap neemt per se datawetenschappers aan. Hier zijn enkele van de meest populaire functietitels met betrekking tot datawetenschap en het gemiddelde salaris voor elke functie, volgens gegevens van PayScale:
- Analytics-manager – $ 100.099
- Business intelligence-analist – $ 70.868
- Gegevensanalist – $ 62,723
- Gegevensarchitect – $ 122.882
- Gegevensingenieur – $ 93,145
- Onderzoeksanalist – $ 57,615
- Onderzoekswetenschapper – $ 82.957
- Statisticus – $ 77,545