page title icon Wat is het worstelen van gegevens? – DATAVERSITEIT

Data-wrangling, ook wel bekend als data-mungling, geeft vorm aan data die in verschillende formaten worden gevonden en herstructureert deze om bedrijfswaarde te bieden. Bedrijven implementeren een verscheidenheid aan datasystemen om zakelijke beslissingen te sturen en problemen op te lossen om een ​​situatie te optimaliseren. In de loop van de tijd evolueert de zakelijke context, met nieuwere technologieën, aanvullende gegevensbronnen, bijgewerkte regelgeving en verschillende vereisten van belanghebbenden. Deze verandering resulteert in grotere, slordiger uitvoer van ongestructureerde en gestructureerde gegevens die niet voldoen aan de informatiebehoeften.

Data-analisten, datawetenschappers en anderen die informatie zoeken in datasystemen, moeten transformatiegegevens aanpassen aan de huidige context en vereisten. Vaak eindigt dit als een semi-automatische aanpak om de gegevens op te schonen, wat tijd en geld kost uit andere processen. Bedrijven willen beter gegevensbeheer, integratie, en automatisering om de behoefte aan data-wrangling en data-opmaak te verminderen.

Andere definities Data Wrangling omvatten:

  • “Het proces waarbij gegevens van de ene vorm naar de andere worden getransformeerd om ze voor analyse voor te bereiden en enkele uniforme resultaten te leveren. Het wordt ook wel ‘data munging’ genoemd. ”(Pete Aven)
  • “Gegevens kopiëren naar verschillende gegevenssilo’s die zich in de cloud of elders kunnen bevinden.” (Jennifer Zaino)
  • “Stappen die gegevens van onbewerkte naar opgeruimde vorm converteren.” (Harvard universiteit)
  • “Neem gegevens in het ene formaat en zet het in een ander formaat dat u nodig hebt.” (MIT)
  • Het proces waarbij verschillende datasets bij elkaar worden gebracht, zoals cowboys die vee bijeendrijven. (Forbes)

Voorbeelden van data-wrangling zijn:

  • Datawetenschappers ruzie met gegevens om schone datasets voor analyse te krijgen
  • Een klant bezoekt een winkel en wil een rapport van zijn of haar uitgaven; de aankoopinformatie van de detailhandelaar, verspreid over verschillende systemen, klopt echter niet. Het kost de klant dus extra tijd om de informatie te krijgen
  • Verzamelen en schoonmaak gegevens om kunstmatige intelligentie te trainen

Bedrijfsgegevens komen in de war om:

  • Verenig informatie uit verschillende bronnen
  • Creëer een enkele weergave van een klant of product
  • Verkrijg essentiële zakelijke inzichten handmatig en herhaaldelijk vanwege een gebrek aan automatisering
  • Antwoord Onderzoek vragen

Afbeelding gebruikt onder licentie van Shutterstock.com

Plaats een reactie