Een korte geschiedenis van metadata

Een korte geschiedenis van metadata

Een korte geschiedenis van metadata

Metadata is een kleine hoeveelheid gegevens die is ontworpen om referentie-informatie over andere gegevens te bieden. Bijvoorbeeld, in 280 voor Christus, de Grote bibliotheek van Alexandrië bevestigde een kleine, bungelende tag aan het einde van elke individuele scroll. De tags gaven de titel, het onderwerp en de auteur, zodat bibliotheekgebruikers de inhoud konden aannemen zonder elke scroll te hoeven uitrollen, en dus konden de scrolls naar hun juiste locatie worden teruggebracht. Hoewel bibliothecarissen uit die tijd de informatie op de tags ‘metadata’ niet noemden, is dit een van de vroegst geregistreerde voorbeelden van metadata, en uiteindelijk uitgegroeid tot de kaartcatalogi (een andere versie van metadata), die een paar decennia geleden in bibliotheken werd gebruikt. De eerste vermelding van metadata voor computersystemen komt van MIT’s Stuart McIntosh en David Griffel, in 1967, toen ze de behoefte aan een digitale “metataal. ”

Een primair doel van metadata is om onderzoekers te helpen bij het vinden van relevante informatie en het ontdekken van bronnen. Trefwoorden die in de beschrijvingen worden gebruikt, worden ‘metatags’ genoemd. Metadata worden ook gebruikt bij het organiseren van elektronische bronnen, het bieden van digitale identificatie en het ondersteunen van het bewaren en archiveren van gegevens.

Metadata helpt onderzoekers bij het ontdekken van bronnen door relevante criteria te lokaliseren en locatie-informatie te verstrekken. In termen van digitale marketing kunnen metadata worden gebruikt om inhoud te organiseren en weer te geven, waardoor marketinginspanningen worden gemaximaliseerd. Metadata vergroten de zichtbaarheid van het merk en verbeteren de ‘vindbaarheid’.

Anders metadata-standaarden worden gebruikt voor verschillende disciplines (zoals digitale audiobestanden, websites of museumcollecties). Een webpagina kan bijvoorbeeld metagegevens bevatten die de softwaretaal beschrijven, de tools die zijn gebruikt om deze te maken en de locatie van meer informatie over het onderwerp. Een museumcollectie zou daarentegen metadata bevatten die het soort kunst, de naam van de kunstenaar en de datum van creatie beschrijven.

De late jaren 1900

In 1979 werd de International Press Telecommunications Council (IPTC) gedefinieerde metadatastandaarden en attributen die in afbeeldingen kunnen worden ingevoegd. Eind jaren tachtig begon de IPTC te werken aan het Information Interchange Model (IIM), een bestandsstructuur met metagegevensattributen die konden worden toegepast op afbeeldingen, tekst en andere mediavormen. Het werd begin jaren negentig voltooid en versnelde de nieuwsuitwisseling tussen nationale en internationale kranten. Hun eerste standaard, de IPTC 7901, overbrugde de kloof tussen teleprinters en computers.

Metadata-attributen en standaarden werden opnieuw ontwikkeld in 1994, toen Adobe een techniek ontwikkelde die metadata daadwerkelijk “in” de digitale beeldbestanden (IPTC-headers) inbedding. Adobe heeft de IIM-metadata-definities van IPTC overgenomen, maar niet de algehele IIM-structuur. Foto’s met IPTC-headers lijken normale TIFF- of JPEG-afbeeldingen te zijn.

Hoewel er verschillende metadatasystemen en -standaarden zijn, zijn er ook gespecialiseerde en algemeen aanvaarde modellen voor het categoriseren van ‘typen metadata’. In 1994 presenteerden Francis P. Bretherton en Paul T. Singley een paper met de titel Metadata: de weergave van een gebruiker, die twee verschillende vormen van metadata heeft ontwikkeld: metadata begeleiden en structurele / controlemetadata. Metagegevens van gids helpen onderzoekers specifieke items te vinden, meestal trefwoorden (metatags) in natuurlijke taal. Het labelen van databaseobjecten (tabellen, kolommen, sleutels en indexen) wordt structurele metagegevens genoemd.

2000-2003

In 2001, NISO (National Information Standards Organization), die zich richt op het creëren van industriestandaarden voor de informatie-industrie (uitgevers, bibliotheken en softwareontwikkelaars), besloot serieus te worden over metagegevens en publiceerde het document, Metadata eenvoudiger gemaakt: een gids voor bibliotheken. In de handleiding staat:

“Er zijn verschillende soorten metadata, inclusief beschrijvende, administratieve en structurele. Beschrijvende metagegevens beschrijven een bron voor doeleinden zoals opsporing en identificatie. Het kan elementen bevatten zoals titel, samenvatting, auteur en trefwoorden. Administratieve metagegevens bieden informatie om een ​​bron te helpen beheren, zoals wanneer en hoe deze is gemaakt, bestandstype en andere technische informatie, en wie er toegang toe heeft. Metadata voor rechtenbeheer is een vorm van administratieve metadata die te maken heeft met intellectuele eigendomsrechten. Structurele metagegevens geven aan hoe samengestelde objecten worden samengesteld, bijvoorbeeld hoe pagina’s worden gerangschikt om hoofdstukken te vormen. “

In 2001 introduceerde Adobe het zogenaamde Uitbreidbaar metadataplatform (XMP). XMP vertegenwoordigt dezelfde soorten metadata als IPTC, maar omvat Extensible Markup Language (XML), die gecodeerde instructies gebruikt voor het weergeven van tekst, en het Resource Description Framework (RDF), een eenvoudige digitale taal voor alle doeleinden die informatie vertegenwoordigt.

Met een XMP-compatibele toepassing kunnen metagegevens worden vastgelegd tijdens het maken van inhoud en vervolgens worden ingesloten in het bestand, evenals een inhoudbeheersysteem. Handige beschrijvingen, zoals de titel, de auteur, doorzoekbare trefwoorden en copyright-informatie, zijn opgenomen in een gemakkelijk te begrijpen indeling.

In 2002 schreef Ralph Kimball in zijn boek De Data Warehouse Toolkit, definieerde metadata als ‘alle informatie die de structuren, bewerkingen en inhoud van het DW / BI-systeem definieert en beschrijft’. Kimball beschreef vervolgens drie soorten metadata:

  • Technische (structurele / controle) metadata zijn de informatie die is opgeslagen in uw databron. Het is het fysieke schema (kolommen, tabellen en de opgeslagen gegevens in die objecten). Dit soort metadata wordt vaak gebruikt om het datadictionary samen te stellen. Wanneer de data woordenboek en de metadata-opslagplaats worden vergeleken, kan een gap-analyse van ontbrekende of onvolledige gegevens worden uitgevoerd.
  • Zakelijke metadata verwijst naar de inhoud van een datawarehouse, inclusief de gegevens die beschikbaar zijn, waar de gegevens vandaan kwamen en de relatie met andere gegevens.
  • Metadata van processen gaat over de operationele resultaten van het datawarehouse. Procesmetagegevens zijn informatie die is gekoppeld aan de vastlegging van metrische gegevens wanneer een systeem wordt uitgevoerd, inclusief traceerbaarheid, afkomst en auditinformatie. Wanneer werkte het systeem? Voor hoelang?

In 2003 besloot Priscilla Caplan, een adjunct-directeur voor de digitale bibliotheekdiensten bij het Florida Center for Library Automation, om de evolutie van metadata naar het volgende niveau. Ze brak metadataschema’s op in verschillende categorieën, die hun belangrijkste aspecten van functionaliteit weerspiegelen, zoals:

  • Beschrijvende metadata verwijzen naar ontdekking, identificatie en selectie. Beschrijvende metadata kunnen ook collocatie en acquisitie omvatten.
  • Structurele metadata beschrijft de interne organisatie. In de digitale omgeving bestaan ​​logische bronnen vaak uit meerdere fysieke bestanden. Structurele metadata relateert fysieke bestanden aan elkaar en aan de structuur van logische objecten.
  • Administratieve metagegevens bieden informatie die is ontworpen voor het beheer van bronnen. Dit omvat wanneer en hoe objecten zijn gemaakt, de persoon die verantwoordelijk is voor het controleren van de toegang ertoe en de controle- of verwerkingsactiviteiten die daarmee verband houden.
  • Metagegevens van Rights Management verwijzen naar intellectuele eigendomsrechten. In systemen moet het beheer van rechten worden goedgekeurd aan de hand van gebruikersprofielen (bewezen door juiste identificatie) om ervoor te zorgen dat het materiaal op de juiste manier wordt verspreid en de juiste betalingen worden gedaan aan de rechthebbende.
  • Metadata voor bewaring gaat in wezen over beheer. Dit bevat informatie die wordt gebruikt om bronnen te archiveren en te bewaren. Digitale bewaring beschrijft een proces dat is ontworpen om ervoor te zorgen dat een bron toegankelijk is.
  • Technische metadataschema’s zijn over het algemeen erg omvangrijk en gedetailleerd, omdat ze vaak worden gebruikt door IT of voor computer-naar-computercommunicatie. Technische metadata beschrijft informatie over technologie (eigendom van de database, fysieke kenmerken van een database, afstemming van prestaties en meer). Technische metadata is de term die wordt gebruikt om de software en hardware te beschrijven die nodig is om digitale records te reproduceren, inclusief videoformaten (mpeg) en pdf-formaten.

Metadata en marketing

In 2007 veranderde Google de manier waarop hun zoekmachine werkte. Google was eerder gebaseerd op een lijst met geschikte links (voor sommige werd betaald, andere niet). Maar op dit moment breidde Google zijn zoekplatform uit met nieuws, afbeeldingen en video. Als gevolg hiervan zouden nieuwe metadata worden geïntroduceerd om websites en informatie doorzoekbaar en relevant te maken voor SEO.

Metadata die online en in digitale marketing worden gevonden, is een cruciaal hulpmiddel voor moderne marketing. Metadata kunnen helpen mensen vinden een website. Het maakt webinhoud beter doorzoekbaar, en bij efficiënt gebruik kunnen metadata het aantal bezoeken verhogen. Marketeers kunnen hun metadata online ordenen om het bereik van de inhoud te maximaliseren. Nauwkeurige, georganiseerde metagegevens zijn de sleutel tot het maken van een website die gemakkelijk kan worden gevonden.

Bovendien hebben metadata een aanzienlijk effect gehad op Search Engine Optimization (SEO), aangezien het deel uitmaakt van het zoekproces van Google en wordt weergegeven op hun Search Engine Results Page (SERP). Door de metadata te optimaliseren, deze zoekwoordrijk en conversiegericht te maken, kan het verkeer naar een site toenemen.

Metadata-automatisering

Octopai biedt machine learning-technologie die automatisch brengt metagegevens in kaart en beheert deze verzameld uit de verschillende informatiesystemen van een organisatie, met gebruikmaking van één doorzoekbare interface. De drie medeoprichters waren gefrustreerd omdat ze de reis van gegevens handmatig moesten traceren telkens wanneer ze specifieke metadata wilden vinden. Het zou uren duren en was vaak onnauwkeurig.

Amnon Drori, Gal Ziton en Itai Kahalani gebruikten hun frustraties om een ​​efficiënte technologische oplossing te vinden en creëerden een geautomatiseerd platform waarmee BI-onderzoekers op efficiënte wijze gedeelde metadata kunnen ontdekken. Hun platform verhoogde de productiviteit aanzienlijk, verkortte de time-to-market en verminderde risico’s veroorzaakt door onnauwkeurige gegevens.

Metadatabeheer en AVG-naleving

Op 25 mei 2018 heeft de Algemene verordening gegevensbescherming (AVG) werd wet. De nieuwe GDPR-regelgeving vereist dat alle EU-klantgegevens waarmee identificatie van consumenten kan worden geanonimiseerd of volledig worden verwijderd. In wezen kunnen gegevens beschikbaar blijven voor doeleinden van Big Data-onderzoek, maar kunnen ze niet worden gebruikt om een ​​persoon te ‘stalken’. Om hieraan te voldoen, moeten bedrijven een bewustzijnsniveau bereiken met betrekking tot hun gegevens dat voorheen niet bestond.

Om een ​​goed begrip te krijgen van de data die een bedrijf bezit, moet men toegang hebben tot de bijbehorende metadata. Metadatabeheer helpt u te zien waar de gegevens vandaan komen, de locatie in verschillende systemen en hoe ze worden gebruikt. Metadata worden gebruikt om gegevens te besturen en zijn nodig om GDPR-compatibel.

Afbeelding gebruikt onder licentie van Shutterstock.com

Meer informatie over ?

Een korte geschiedenis van metadata

Wij vertellen er graag meer over tijdens een gesprek met onze BI experts.

Meer kennis uit deze categorie