Wat is gegevensdetectie? – DATAVERSITEIT

Gegevensdetectie

Data discovery beschrijft processen voor het begrijpen van datasets die voorhanden zijn voor data-integratie en / of data-analyse. Deze stap vindt plaats in het ontwerp en zou moeten combineer technische zoek van tools met vakkennis, van mensen. Tijdens het ontdekken van gegevens wordt bij de beoordeling een weergave op hoog niveau genomen data voorbereiding, of datakwaliteitsbehoeften. Gegevensdetectie kan worden onderverdeeld in twee concepten:

  • Handmatige gegevensopsporing: In de afgelopen 20 jaar, voordat machine learning vorderde, dataspecialisten in kaart gebrachte gegevens door de enige hersenkracht van mensen. Simpel gezegd, mensen kritisch nagedacht over welke gegevens beschikbaar zijn, waar deze worden opgeslagen en waarom en wat er aan de eindklant moet worden verstrekt. Bedrijven bewaakten metadata en data lineage discovery om meer te weten te komen over gegevenscategorisatie en -stroom. Datastewards, meestal mensen met geavanceerde technische kennis, die zorgen voor gegevensactiva, documentregels en -standaarden die het gegevensontdekkingsproces begeleiden. Bij deze benaderingen conceptualiseren en / of tekenen mensen een kaart om alle gegevens in een organisatie te begrijpen.
  • Slimme gegevensopsporing: Met de technologische vooruitgang in de afgelopen twee jaar omvatte de definitie van gegevensdetectie geautomatiseerde manieren om gegevens te presenteren, om diepere zakelijke inzichten te onthullen. Slimme gegevensdetectie vertegenwoordigt een sprong voorwaarts met verbeterde analyses en machine learning. Kunstmatige intelligentie bereidt, conceptualiseert, integreert, en presenteert, meestal door middel van visuals, verborgen patronen en inzichten. Bedenk dat het algemene begrip en de analyse van de beschikbare datasets zich bevindt in de machines waarop computers vragen ontvangen, wat bewerkingen uitvoeren in een zwarte doos en met hun beredeneerde antwoorden komen.

Sommigen op het gebied van Data Science kunnen gegevensdetectie dubbelzinnig maken met geautomatiseerde slimme tools voor gegevensdetectie. Zowel handmatige als geautomatiseerde tools werken echter het beste onder de definitie van gegevensdetectie, aangezien beide in artikelen kunnen worden besproken en geïmpliceerd. Zoals AnalyticsWeek stelt: “Machine leren is de tussenpersoon die het gegevensontdekkingsproces verbetert om het geschikt te maken voor de prominente zorgen over gegevensbeheer en naleving van regelgeving waarmee hedendaagse ondernemingen worden geconfronteerd. “

Andere definities van Data Discovery zijn onder meer:

  • “Een resultaat waarmee zakelijke gebruikers gebruik kunnen maken van Advanced Analytics en burgerdatawetenschappers kunnen creëren.” (Kartik Patel)
  • “Tools die gegevens opschonen en voorbereiden, verborgen patronen en correlaties vinden en inzichten bieden zonder tussenkomst van de gebruiker.” (Paramita (Guha) Ghosh)
  • “Praktijken, architectonische technieken en tools voor het bereiken van een consistente toegang tot en levering van gegevens over…. de onderneming om te voldoen aan de vereisten voor gegevensverbruik van alle applicaties en bedrijfsprocessen. ” (Gartner)
  • “In kaart brengen van informatierelaties die worden ondersteund door machine learning.” (Forbes)
  • Het zoeken naar waar gevoelige gegevens zich bevinden, zodat deze adequaat kunnen worden beschermd of veilig kunnen worden verwijderd. (MIT IST)

Gegevens Ontdekking Gebruiksvoorbeelden zijn:

Bedrijven gebruiken gegevensdetectie om:

  • Identificeer subtiele patronen
  • Leef wetten na, zoals de Algemene data Beschermingsverordening (AVG)
  • Geef niet-technische mensen of datawetenschappers van burgers toegang tot data-analyse
  • Om de volledigheid van gegevens te testen en ervoor te zorgen
  • Verlaag de kosten tot wel 80 procent

Afbeelding gebruikt onder licentie van Shutterstock.com

follow:
admin

admin

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige