Deduplikering: Nu skal der ryddes op i de voksende bjerge af overflødige data

Op mod halvdelen af gemte data er overflødedige, fordi data - f.eks. om personer, projekter eller produkter - i virkeligheden allerede findes.

Vi gemmer data som aldrig før. Men vi gemmer også gentagne og dermed overflødige data som aldrig før. Et forskningssamarbejde vil nu sikre en teknologisk mere effektiv opbevaring i skyen med softwareløsninger, der kan fjerne overflødige data, skriver ZdNet.

Distribueret data storage giver nye udfordringer som skalerbarhed, redundans, pålidelighed og fejltolerance, hvor single node-deduplikationsmetoder ikke kan anvendes, siger CEO Serguei Beloussov fra Acronis.

Det er den amerikanske leverandør af backup- og data recovery-software Acronis, som er gået sammen i forskningsprojektet med Data Storage Institute (DSI) under Styrelsen for videnskab, teknologi og forskning - kaldt A*STAR - i Singapore.

Offentliggørelsen følger Acronis' etablering af et forsknings- og udviklingslaboratorium i Singapore i juli sidste år, hvor det også lød, at man ville investere mere end 55 millioner dollar i FoU over de næste fem år.

Konkret vil initiativet med DSI udvikle skalerbar deduplikering til distribueret datalagring, hvilket er vigtigt for at kunne rydde op i overflødige data og reducere forbruget af teknisk cloudydelse.

Kun meget lidt forskning i deduplikering til nutidens cloudsystemer

I et e-mail-interview, forklarer CEO Serguei Beloussov fra Acronis, at de fleste eksisterende deduplikeringssoftware blev udviklet til single-node storage-systemer. Dermed fungerer de ikke så godt i et cloud-miljø.

»Distribueret data storage giver nye udfordringer som skalerbarhed, redundans, pålidelighed og fejltolerance, hvor single node-deduplikationsmetoder ikke kan anvendes,« siger Beloussov.

»Der er ikke blevet arbejdet ret meget inden for dette område. Meget af det, der er blevet udviklet i Singapore, er alene designet til at behandle meget store og eksponentielt voksende datamængder.«

Det fælles forskningsteam består af fem softwareingeniører fra Acronis og DSI, der skal arbejde med de vigtigste projektideer frem til oktober i år.

Ifølge IDC vil de globale datamængder stige med 40 procent hvert år og ramme 44 zettabyte i 2020.

Omkring 20 procent af data vil blive gemt i skyen.

Beloussov bemærker, at dette ville øge efterspørgslen på mere effektiv opbevaring med avanceret data-deduplikeringsteknologi for bedre at kunne understøtte de mange cloud-applikationer.

»Ifølge vores estimater vil ny teknologi potentielt kunne halvere de lagrede datamængder,« sagde han.

Arbejdet med dataduplikering har mange facetter og kan anvendes andre steder som inden for området for datasikkerhed, dataoverførselsprotokoller og datacenter-effektivitet.

Hvis man opnår mere effektive storagesystemer, kan det for eksempel også udnyttes til at etablere individuelle niveauer for redundans, alt efter behov.

Det vil igen gøre det muligt for administratorer mere effektivt at have adgang til forskellige lagersystemer med forskellige sikkerhedskrav, der understøtter forskellige typer dataopbevaring.

Følg forløbet

Kommentarer (0)

Log ind eller opret en konto for at skrive kommentarer

JobfinderJob i it-branchen