Waarom uitgebreide ontdekking en analyse uw ongestructureerde datamigratieplan kunnen maken of breken

Klik voor meer informatie over auteur Brian Murphy.

Ongestructureerde data groeien sneller dan ooit. Volgens het huidige onderzoek van de meeste analistenfirma’s groeit het zelfs aanzienlijk sneller dan gestructureerde gegevens. Volgens IDC, 80 procent van wereldwijde data zal tegen 2025 ongestructureerd zijn. En terwijl de enorme hoeveelheid ongestructureerde data zo snel groeit, neemt ook de waarde ervan toe om bedrijven in staat te stellen snellere, slimmere en meer strategische datagestuurde beslissingen te nemen. Bijgevolg overschrijden de capaciteiten in bestandssystemen tegenwoordig doorgaans honderden terabytes (TB’s), en in veel gevallen zelfs meerdere petabytes (PB’s). Dit zijn gegevens die organisaties willen behouden, beschermen en benutten.

Deze enorme groei van ongestructureerde gegevens in bestandssysteemomgevingen heeft het vernieuwen van hardware echter tot een uiterst zwaar proces gemaakt. Wat de uitdaging nog groter maakt, is dat de datasets in deze omgevingen vaak niet volledig worden begrepen als het gaat om gebruiks- en toegangspatronen. In de homedirectory’s van gebruikers in veel bedrijfsomgevingen worden bijvoorbeeld werknemersgegevens opgeslagen die niet essentieel zijn voor het bedrijf. Desalniettemin hebben sommige werknemers hun persoonlijke gegevens intact gelaten door meerdere technische vernieuwingen.

Bovendien kunnen verschillende voorschriften in sommige gevallen resulteren in datasets die voor langere tijd, zo niet voor onbepaalde tijd, moeten worden bewaard en beschermd. Ten slotte is het niet ongebruikelijk dat klanten vast komen te zitten in hun opslagleverancier vanwege de angst voor platformonafhankelijke migraties.

“Een doel zonder plan is slechts een wens.” – Antoine de Saint-Exupery

Planning en voorbereiding zijn ontegensprekelijk de meest kritische stappen in het ongestructureerde data migratie werkwijze. Om het beste plan te implementeren, is het echter van cruciaal belang dat u het beste zicht heeft op uw gegevensomgeving. En de beste manier om dat te doen (zou ik zeggen – de enige manier) is met een softwaretool die diepgaande ontdekkings- en analysemogelijkheden biedt. Wanneer u op zoek bent naar een dergelijke tool, zoek er dan een die direct kan worden aangesloten op de beheer-API van de beste bestandssysteemtechnologieën in de branche om alle relevante paden volledig te ontdekken en te analyseren. Bovendien moet de tool alle volgende gebieden kunnen ontdekken, analyseren en rapporteren:

  • SMB-aandelen
  • NFS-exporten en aliassen
  • Quota (adviserend, zacht en hard)
  • Gebruikte capaciteit
  • Replicatie

Met zo’n planningsrapport in de hand kan de gebruiker de ideale strategie voor de migratie bepalen en deze vervolgens uitvoeren.

Laten we deze kritieke zichtgebieden eens nader bekijken.

SMB / NFS-shares en -exports

Met Shares en Exports moet het ontdekkingsproces van uw softwaretool een rapport kunnen genereren met de volgende gegevenspunten:

  • Bestanden server
  • Pad
  • Gedeelde status
  • Lijst met aandelen, exporten en aliassen
  • Aantal aandelen en exporten
  • Aantal onderliggende aandelen en exporten
  • Aantal moederdelen en exporten

Deze informatie kan op zijn beurt worden gebruikt om te bepalen welke paden relevant zijn in uw omgeving en om een ​​strategie voor uw migratie verder te ontwikkelen. Met deze informatie kunnen beheerders nu bijvoorbeeld meerdere keren identificeren dat exports worden gedeeld en meerdere paden identificeren die nuttig kunnen zijn bij het bepalen van het gebruik van symlinks om dezelfde gebruikerservaring te bieden bij platformonafhankelijke migraties.

Quota

Quotarapporten bieden gebruikers toegang tot informatie die erg handig kan zijn om te bepalen welke waarden mogelijk naar de nieuwe opslag moeten worden gemigreerd. In quotarapporten zou u het volgende moeten vinden:

  • Bestandsserverinformatie
  • Pad
  • Oorsprong van het quotum
  • Capaciteitsquota
  • Capaciteit oorsprong
  • Gebruikte capaciteit
  • Geschatte aantal items

Capaciteit

Capaciteitsrapporten kunnen worden gebruikt om capaciteit in de omgeving op verschillende niveaus te identificeren. Gebruikers kunnen capaciteit afleiden door bijvoorbeeld naar het kindniveau te kijken. Capaciteitsrapporten moeten gebruikers de volgende gegevenspunten bieden:

  • Bestanden server
  • Pad
  • Capaciteit oorsprong
  • Gebruikte capaciteit
  • Geschatte aantal items

Replicatie

Replicatierapporten kunnen worden gebruikt om te bepalen of replicatie op het pad is geconfigureerd, of gegevens worden gerepliceerd als onderdeel van een bovenliggende directoryreplicatie, of onderliggende directory’s worden gerepliceerd, of een gefilterde bestandsset wordt gerepliceerd of dat er helemaal geen replicatie is. De volgende gegevenspunten moeten worden vastgelegd in een replicatierapport:

  • Bestanden server
  • Pad
  • Repliceren
  • Replicatiepaden
  • Replicatiedoelen

Tweemaal meten, eenmaal knippen

De gegevensontdekking en analyse waarvan nu kan worden genoten via geselecteerde softwareoplossingen, zal het creëren en uitvoeren van intelligente datamigratiestrategieën mogelijk maken. Niet alleen dat, maar voor degenen die vervolgens de volgende stap willen zetten, kunnen de bevindingen ook worden gebruikt om te helpen bepalen hoe al die opslag in de nieuwe omgeving kan worden opgedeeld.

Het komt er echter op neer: ik ga erop uit en zeg: absoluut geen enkele beheerder kan het risico lopen dat de gegevensmigratie mislukt. En, zoals Sir Winston Churchill ooit zo welsprekend zei: “Hij die geen plannen maakt, is van plan te mislukken.” Maar met de juiste planning, mogelijk gemaakt door de juiste tools, zal uw volgende ongestructureerde datamigratie een stuk minder stressvol zijn en, nog belangrijker, een groot succes!

follow:
admin

admin

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige