Data Preparation?”/>
Datavoorbereiding beschrijft het proces om data klaar te maken voor gebruik in analyse. In het verleden was datavoorbereiding een tijdrovende taak die door het IT-team werd afgehandeld, met inbegrip van ‘data-extractie, transformatie en laden (ETL), toegang tot datawarehouses en datamarts, en veel gecompliceerde massering en manipulatie van data in andere data bronnen, ” zegt Kartik Patel, maar organisaties wenden zich steeds meer tot geavanceerde zelfbedieningstools voor gegevensvoorbereiding waarmee zakelijke gebruikers zelf gegevens kunnen voorbereiden.
Andere definities van gegevensvoorbereiding omvatten:
- Een “voorverwerkingsstap waarin gegevens uit een of meer bronnen worden opgeschoond en getransformeerd om de kwaliteit ervan te verbeteren voordat ze worden gebruikt in bedrijfsanalyses.” (Infomatica)
- Technologie waarmee beheerders snellere en betere beslissingen kunnen nemen via datakwaliteit en gegevenstoegang. (Jon Pilkington)
- “Datavoorbereiding is het proces van het verzamelen van gegevens uit een aantal (meestal ongelijksoortige) databronnen, en die vervolgens profileren, opschonen, verrijken en combineren tot een afgeleide dataset voor gebruik in een stroomafwaarts proces.” (Paxata)
- Een proces om “de relevante gegevensitems te identificeren en te scheiden van een grote hoeveelheid gegevens, zodat de afzonderlijke items kunnen worden gebruikt in analysequery’s.” (TechRepublic)
- De “meest tijdrovende taak op het gebied van analyse en BI [that] evolueert van een selfservice-activiteit naar een zakelijke noodzaak. ” (Gartner)
- “Het proces van het verzamelen, opschonen en consolideren van gegevens in één bestand of gegevenstabel, voornamelijk voor gebruik bij analyse.” (Datawatch)
Bedrijven gebruiken gegevensvoorbereiding om:
Foto tegoed: Shutterstock.com