Hoe gegevensontdubbeling de kosten van cloudgegevens verlaagt

Hoe gegevensontdubbeling de kosten van cloudgegevens verlaagt

Klik voor meer informatie over auteur Rebekah Dumouchelle.

Het natuurbrandseizoen in 2020 was bijzonder intens. Voor velen van ons hier in Colorado en andere westerse staten staat het idee van voorbereiding op rampen altijd hoog in het vaandel. Wat zouden we grijpen als we onmiddellijk moesten evacueren? We willen natuurlijk dat ons gezin en onze huisdieren veilig zijn. En we willen zoveel mogelijk kostbare foto’s beveiligen.

Mijn Duitse Dog, Miles, neemt veel ruimte in de auto in – waardoor er weinig ruimte overblijft voor ‘spullen’, waar ik sowieso geen tijd voor zou hebben. Mijn beste gok voor het opslaan van onvervangbare foto’s? Heb ze op een externe schijf in mijn tas voor noodgevallen, zodat ik de afbeeldingen bewaar, zodat ik ze later kan bekijken, afdrukken of delen. Ervoor zorgen dat deze gegevens – mijn meest betekenisvolle .jpgs – beschermd en toegankelijk zijn, maakt deel uit van mijn persoonlijk noodherstelplan (DR).

Net zoals ik de ruimte moet evalueren die nodig is om dingen op te slaan en te openen die voor mij persoonlijk het belangrijkst zijn, moeten bedrijven evalueren hoe ze hun gegevens moeten beheren. Hoe efficiënt is uw strategie voor gegevensbescherming? Hoe maak je data regelmatig toegankelijk, zonder afhankelijk te zijn van en te betalen voor het opslaan van meerdere exemplaren? In beide gevallen kan deduplicatie een belangrijke rol spelen in uw Gegevensstrategie voor 2021 en daarna. Hier zal ik bekijken wat gegevensduplicatie is en de twee belangrijkste scenario’s waarin gegevensontdubbeling de kosten voor cloudgegevens aanzienlijk kan verlagen.

Wat is gegevensontdubbeling? En hoe werkt het?

Gegevensontdubbeling (ook bekend als ontdubbeling) is het proces waarbij meerdere gegevensblokken worden verwijderd, waardoor het niet meer nodig is om kopieën van de gegevens op te slaan. Het eindresultaat: gegevensontdubbeling verkleint uw gegevensvoetafdruk, waardoor het totale aantal opslag vereist. Het gebruik van minder opslagruimte, zowel aan de voorkant als aan de achterkant, leidt tot lagere opslagkosten voor uw gegevens.

In de praktijk kunt u met een deduplicatiesnelheid van 65 keer mogelijk 65 TB aan gegevens opslaan op slechts 1 TB aan logische ruimte, waardoor de kosten evenredig worden verlaagd. PowerProtect DD van Dellbereikt bijvoorbeeld deze gegevensefficiëntie aan de achterkant door niet dezelfde gegevensbits te synchroniseren of een back-up te maken, maar alleen de delta’s.

Wat betekent dit specifiek voor cloudgegevens?

Clouds bieden een flexibele, op hulpprogramma’s gebaseerde methode om gegevens extern op te slaan. Zoals jij ga naar de cloud – of het nu gaat om een ​​enkele cloud of om een ​​multi-cloudbenadering te implementeren – uw gegevens kunnen snel groeien met opslag die on-demand wordt geschaald met uw zakelijke vereisten. Helaas bieden clouds geen grote gegevensefficiëntie. Hoe meer gegevens, hoe hoger de opslagkosten. Deze groeiende kosten kunnen uw bedrijfsresultaten aanzienlijk schaden. U heeft uw gegevens nodig om voor u beschikbaar te zijn; de kosten om het op te slaan zouden niet onbetaalbaar moeten zijn.

Organisaties met een hybride cloud, meerdere openbare cloudinstances of on-prem datacreatie kunnen meerdere kopieën van siled data elimineren. Deduplicatie biedt een enkele gegevensopslag een toegankelijke kopie van de gegevens. Dit zorgt voor een gestroomlijnde architectuur, waarbij beheer van slechts dat ene stuk opslag vereist is. Deze benadering biedt voordelen voor use cases met zowel laagfrequente als hoogfrequente toegang tot gegevens.

Scenario 1: Bescherming van openbare cloud (toegang met lage frequentie)

Met deduplicatie kunt u uw gegevens beschermen en herstellen in het geval van een catastrofale storing of ramp. Gegevens waar u niet vaak toegang toe hebt, maar waarvan u afhankelijk bent voor back-up of in een DR-scenario, kunnen worden gecomprimeerd en opgeslagen in een kleine ruimte. Hierdoor hoeft u niet te betalen voor de hoogste opslagprestatielaag, wat betekent dat u niet hoeft te betalen voor grote hoeveelheden opslag aan de achterkant.

Gecentraliseerde gegevensbescherming – met een enkele naamruimte en een verbinding met lage latentie naar alle grote openbare clouds – stelt u in staat om globale deduplicatie te maximaliseren tussen gedistribueerde gegevens waarvan een back-up is gemaakt vanuit meerdere clouds. Dit vergemakkelijkt ook onmiddellijk herstel van uw gegevens (gezien als een native read en write) naar elke cloudprovider, met front-end besparingen en zonder het risico van vendor lock-in.

Scenario 2: de gegevensvoetafdruk drastisch verkleinen

Van gededupliceerde gegevens wordt een back-up gemaakt naar cloud-gekoppelde opslag, zowel op locatie als in de cloud, waardoor meerdere kopieën van geïsoleerde gegevens worden geëlimineerd. Dit verlaagt de kosten voor back-up- en herstelopslag en vormt de basis voor herstel en failover naar de cloud naar keuze van de organisatie.

Maak in het begin niet meerdere kopieën van gegevens

De kans is groot dat uw gegevens exponentieel groeien. Die datagroei stimuleert de behoefte aan back-ups, archieven van die gegevens en de noodzaak om voldoende opslagruimte aan te schaffen, zowel on-premise als misschien in een enkele cloud. Zonder deduplicatie moet u meer opslagarrays aanschaffen, wat resulteert in hogere hardware- en beheerkosten. Als je met twee of drie clouds werkt, heb je te maken met twee of drie keer zoveel complicaties.

Overweeg een bedrijf dat 2 PB-opslag in de cloud nodig heeft. Afhankelijk van het type opslag dat ze gebruiken, kan het heel veel volumes kosten om die gegevens te archiveren. Amazon S3 Glacier heeft bijvoorbeeld een maximale grootte van 40 TB per archief. NetApp Cloud Volumes hebben een maximum van 100 TB per volume, waarvoor 20 volumes nodig zijn om 2 PB op te slaan, samen met 20 IP’s, 20 naamruimten en 20 beheerpunten. Ze zouden alle 2 PB kunnen opslaan op een met de cloud verbonden Dell EMC Isilon-array, maar ze betalen nog steeds voor een 1-op-1 hoeveelheid opslag. Geen van deze oplossingen biedt de efficiëntie van deduplicatie. In plaats daarvan, met een oplossing die tot 65 keer deduplicatie biedt, zoals de hierboven genoemde PowerProtect, zouden ze de opslagruimte die nodig is om een ​​back-up van 2 PB te maken, kunnen terugbrengen tot mogelijk 30-35 TB.

Waar het op neerkomt: meerdere gebieden voor kostenbesparingen

Terwijl u zich verdiept in de inspanningen om de kosten van de cloud te optimaliseren, realiseert u zich misschien dat u met uw huidige aanpak meer betaalt dan u dacht. Deduplicatie maakt besparingen mogelijk door:

1. De hoeveelheid opslagruimte die u moet kopen verminderen: Net zoals een cd met foto’s een gestroomlijnde opslagfunctionaliteit biedt waarmee u naar wens afbeeldingen kunt bekijken of afdrukken, zo minimaliseert gegevensontdubbeling de benodigde hoeveelheid opslagruimte – met 2 keer of meer.

2. Het aantal benodigde netwerken verminderen: Door te ontwerpen voor een enkele, toegankelijke kopie van uw gegevens, behoudt uw organisatie de controle met een cloud-aangrenzende service. Dit voorkomt ook vendor lock-in en bijbehorende kosten, zoals uitgaande kosten.

3. Beheer overheadkosten verminderen: Door uw gegevensbescherming voor alle clouds (inclusief AWS, Azure, Google Cloud Platform en VMware Cloud on AWS) te centraliseren, stroomlijnt u het beheer, waardoor de bijbehorende kosten, complexiteit en wildgroei worden verminderd.

Uiteindelijk kunnen inspanningen voor datadeduplicatie exponentiële efficiëntie en besparingen opleveren als onderdeel van een goed beheerde datastrategie.