Gå til hovedindhold
Version2 it for professionelle
Forsiden

Hovedmenu

  • It-nyheder
  • Blogs
  • It-job
  • It-firmaer
  • Whitepapers
  • Opret bruger
  • Log ind
Du kan logge ind med din e-mail-adresse
Der er forskel på store og små bogstaver i adgangskoden.
Glemt adgangskode?
Se kommentarer (11)
Emner Storage, Backup

Deduplikering frigiver lagerplads ? men kan kvæle ydelsen

Det lyder besnærende at kunne spare storage-plads ved ikke at gemme overflødige kopier. Men deduplikering skal bruges klogt, for ellers kan det gå ud over ydelsen.

Af Jesper Stein Sandal Onsdag, 15. december 2010 - 8:12

Terabytes er ikke gratis, og derfor vil storageleverandørerne gerne sælge software, som kan hjælpe med at udnytte lagerpladsen bedst muligt, så man får mest for pengene. Men selvom deduplikering ser smukt ud på papiret, så har det også en pris i form af tabt ydelse.

Deduplikering går ud på, at man identificerer blokke af data, der er identiske. I stedet for at have to eller flere kopier liggende af de samme data, så beholder man én kopi og erstatter de øvrige med henvisninger til originalen. Henvisningerne optager langt mindre plads end den fulde kopi, og på den måde får man udnyttet kapaciteten bedre.

Men mange kunder opdager, at deduplikering går ud over ydelsen, når eksempelvis flere applikationer forespørger de samme data, eller der laves mange ændringer.

»Deduplikering kan have forskellige omkostninger. Hvis du har mange pointers til en enkelt kopi, så har du risikoen for, at der kommer mange forespørgsler på at få adgang til den ene kopi,« siger strategidirektør Miki Sandorfi fra Hitachi Data Systems.

Giver mening til backup Han har gennem flere år arbejdet med netop deduplikering og kender til problemet med, at det, man håber på at vinde ved at mindske forbruget af gigabytes, bliver tabt igen på en kraftig stigning i I/O.

»Du er nødt til at se på, hvor deduplikering giver mening. Det er for eksempel til backup, for når du skal have fat i dataene igen, så er det én samlet datastrøm,« forklarer Miki Sandorfi.

Til backup kan deduplikering eksempelvis sørge for, at de snapshots, der bliver taget, kun indeholder de seneste ændringer. Det kan reducere diskforbruget kraftigt.

Men bruger man deduplikering på et system, hvor applikationer skal tilgå dataene hele tiden, så risikerer man, at det skaber en masse ekstra belastning, hvis der er tale om random access. Det kan være tilfældet, hvis systemet skal følge mange pointere til forskellige datablokke, som ligger fysisk spredt på storagesystemet.

»I for eksempel databaser har du ikke så mange kopier af data til at begynde med, så der vil sådan noget som eksempelvis dynamisk tiering give bedre mening,« siger Miki Sandorfi.

Send Tweet
Udskriv

IT-job & karriere

  • Se alle it-job
  • Importer din kompetenceprofil fra LinkedIn
Netcompany søger udviklere, der vil arbejde fra Odense
Udgivet 24. maj 10.09
Senior Software Engineer med mod på ledelse
Udgivet 22. maj 12.57
IT-udviklere til Banken
Udgivet 21. dec 2012 11.41
Erfaren udvikler (København)
Udgivet 24. maj 10.14

Kommentarer (11)

Opret en konto eller log ind for at følge indhold på Version2 - og bliv opdateret via e-mail eller rss

Følg kommentarer
Kasper Sørensens billede
Kasper Sørensen 15. dec. 2010 - 09.13
 
Meget snævert syn på deduplikering

Det fremstilles som om deduplikering udelukkende har at gøre med at rydde op i redundante og replikerede data, men det er langt fra tilfældet. Som regel hvis du snakker om deduplikering indebærer det at matche data op imod hinanden for at se om man uvidende har dobbelt-registreret sine kunder, kontakter, projekter mv. Hvis du eks. har 3 kunder med flg. navne (og i øvrigt lignende øvrige data udover navnene):

K. Sørensen
Casper Sørensen
Kasper Sørensen

Så er der ganske god sandsynlighed for at der er tale om samme person. At rydde op i sådant et rod, det er deduplikering og det ØGER ydelsen - ikke ydelsen af systemerne, men ydelsen af forretningsprocesserne.

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Nicolai Rasmussen 15. dec. 2010 - 09.22
 
Re: Meget snævert syn på deduplikering

Der henvises ikke til deduplikering som en "teknik", men derimod som en feature i moderne storage systemer.

Men det er jo logisk, at deduplikering går ud over I/O. - Det glemmer storage leverandørerne bare lige at fortælle.

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Kristian Vilmann 15. dec. 2010 - 09.29
 
Partsindlæg?

Der er sikkert noget rigtigt i artiklen, men det ligner godt nok et forsøg på at få kunderne til at vælge Hitachi frem for NetApp.
Var det ikke en ide at få NetApp's syn på deduplikering i en tilsvarende artikel?

Og så er der lige den her:

Men bruger man deduplikering på et system, hvor applikationer skal tilgå dataene hele tiden, så risikerer man, at det skaber en masse ekstra belastning, fordi der er tale om random access, hvor en blok af data kan indeholde mange pointere.

Det er muligt der på et tidpunkt har været noget sandhed i det, men umiddelbart ligner det en tekst der er taget ud af en større sammenhæng.
Det giver ikke umiddelbart ret meget mening.

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Jesper Stein Sandals billede
Jesper Stein Sandal 15. dec. 2010 - 10.58
 
Re: Partsindlæg?

[qoute]så er der lige den her:

Men bruger man deduplikering på et system, hvor applikationer skal tilgå dataene hele tiden, så risikerer man, at det skaber en masse ekstra belastning, fordi der er tale om random access, hvor en blok af data kan indeholde mange pointere.

Det er muligt der på et tidpunkt har været noget sandhed i det, men umiddelbart ligner det en tekst der er taget ud af en større sammenhæng.
Det giver ikke umiddelbart ret meget mening.[/quote]

Hej Kristian
Det er rigtigt, at det afsnit vist ikke blev helt så tydeligt, som det var tiltænkt, så nu har jeg omskrevet det.

Mht. f.eks. NetApp, så er de kendt for at være ledende på området, men de er næppe uenige i, at dedupe skal bruges rigtigt. Det er godt til backup og filservere, men gevinsten ved at spare plads opvejes i mange andre tilfælde af højere I/O. YMMV.

Mvh.
Jesper Stein Sandal
Version2

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Nicolai Møller-Andersen 15. dec. 2010 - 12.35
 
Dejavue

Der er skrevet tykke bøger om fordele og ulemper ved deduplikering. De handler om databaser, SQL og normalisering. Der kan alle pointerne hentes, men der er ikke ret mange, som finder SQL cool. Derfor fyldes alverdens harddiske med XML og andet semi-hjemmelavet gøgl, og vips... kan sælgeren fylde deduplikering på sin varmluftsballon.
(Jeg er helt rolig nu)

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Lasse Reinholt 15. dec. 2010 - 13.05
 
eXdupe

Man kan prøve deduplikering på sine data her-og-nu med programmet på http://www.exdupe.com/

Det består af en enkelt stand-alone eksekverbar, i modsætning til de store client/server setups og hardware servere.

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Petter Glenstrup 15. dec. 2010 - 17.36
 
NetApp

Jeg anbefaler altid at bruge Deduplikering på primær storage, der hvor det giver mening. Men det bedste eksempel er virtuelle data, som VMware, VMDK filer, her kan man deduplikere med 80-90%. Samt med NetApp PAMII kan vi lægge alle de 4K blokke der tilbage i Cache istedet for på disk. Så vi ser faktisk med nogle typer data at vi kan bedre performance, bedre effektivitet og samtidigt sparre penge.
Det er rigtigt at nogle OLTP databaser, ikke egner sig til DeDuplikering, men man kan jo slå det til og fra !
Det er klart at HDS ikke syntes det er smart at bruge deduplikering til alle former for data der ligger på primær storage. Jeg er også sikker på at NetApp, hvis de ville, kunne skrive en masse om HDS som de syntes er en dårlig ide. Men jeg er glad for at NetApp skriver mere om hvad de kan og ikke så meget om hvad andre kan og ikke kan.
Som noget nyt kan jeg også nævne at NetApp nu har Data komprimering på primær storage, så vi nu kan deduplikere og komprimere, de samme data (fx. video filer) så der hvor de giver mening at gøre det ene frem for det andet, gør man det. Det hvor man kan få noget ud af begge, ja så slår man det til.
Igen har NetApp mange features der gør at vores storage kan både sikre SLA, TCO, ricisi, effektivitet og performance !

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Niels Astor 15. dec. 2010 - 21.37
 
NetApp & HDS

Kristian du skriver:

Der er sikkert noget rigtigt i artiklen, men det ligner godt nok et forsøg på at få kunderne til at vælge Hitachi frem for NetApp.
Var det ikke en ide at få NetApp's syn på deduplikering i en tilsvarende artikel?

Min kommentar:

Tja, hvad med at få EMC's syn på deduplikering, de er ligesom verdens største inden for storage og deduplikering......

:-) Niels Astor, EMC Danmark

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Jens Melhede 20. dec. 2010 - 15.00
 
Hvad nu hvis dedupe både kan øge performance og spare plads ...

.....ja så betyder det jo at ovenstående ikke længere er en generel betragtning, men blot et udtryk for at sådan kan det være i nogen storage løsninger, men bestemt ikke i f.eks. en NetApp løsning. Læs mere og se fine illustrationer her: http://blogs.netapp.com/virtualstorageguy/2010/03/transparent-storage-ca...

Lige en sidste kommentar: hvad vil du helst køre i, verdens største lastbil eller en hurtig Porsche?

;-) Jens Melhede, NetApp Danmark

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Jonas Dietz-Olsen 23. dec. 2010 - 11.30
 
Re: Hvad nu hvis dedupe både kan øge performance og spare pl ...

Jens, nu er fordelen ved EMC, at der ikke er behov for at vælge, om man ønsker at køre i verdens største lastbil eller en hurtig Porsche.

EMC er markedsledende indenfor alt ekstern storage (SAN/NAS/CAS etc.), og anerkendt som den mest visionære og eksekverende virksomhed i storage industrien. Desuden er EMC også #1 når det kommer til backup, hvor teknologier som deduplikering giver enorme besparelser. Ikke nok med, at EMC er #1 i fohold til source baseret deduplikering (EMC Avamar), hvor deduplikeringen bliver fortaget på hosten inden det lander på backup mediet, så er EMC også #1 når det kommer til target baseret deduplikering (EMC DataDomain) - en virksomhed som NetApp vidst også var interesseret i?

Jonas Dietz-Olsen, EMC.

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer
Jens Melhede 23. dec. 2010 - 14.10
 
Re: Hvad nu hvis dedupe både kan øge performance og spare pl ...

En PorscheLastbil? Det lyder lidt som Frankenstein eller FrankenStorage i mine ører.

Den rene vare til mig - tak.

Det er faktisk utroligt at der er nogen som ikke køber EMC produkter når nu de/I er så markedsledende, visionære og eksekverende indenfor alt. Iøvrigt tilykke med jeres nyeste opkøb af NAS løsningen Isilon, det er jo altid godt med et par valgmuligheder indenfor NAS, nu når I også har flere på hylderne indenfor SAN og Backup osv.

Køb dit nye hifi anlæg i Bilka eller gå i HiFiKlubben - der er op til dig ;-)

  • Stem op 0
  • Stem ned 0
  • anmeld
  • Log ind eller opret en konto for at skrive kommentarer

Tilføj kommentar

Opret en konto eller log ind for at følge indhold på Version2 - og bliv opdateret via e-mail eller rss

Følg kommentarer
Log ind herunder eller opret en bruger for at skrive kommentarer
Du kan logge ind med din e-mail-adresse
Der er forskel på store og små bogstaver i adgangskoden.
Glemt adgangskode?

Seneste nyt

Kommune udvider mobil selvbetjening uden om NemID

Udgivet 18. jun 15.44Opdateret 18. jun 15.44

Whistleblower: Ja, NSA overvåger dig uden dommerkendelse. Obama: Nej - i hvert fald ikke amerikanere

Udgivet 18. jun 14.19Opdateret 18. jun 14.19

Mogens Nørgaards Miracle-mareridt: »Velkommen til IBM«

Udgivet 18. jun 13.23Opdateret 18. jun 15.11

Verdensrekord: Nyt printhoved i A4-bredde sprøjter 70 sider ud i minuttet

Udgivet 18. jun 12.02Opdateret 18. jun 12.03

Mobil-løsning forsinker nyt Oddset-system

Udgivet 18. jun 10.44Opdateret 18. jun 11.12

Flere it-nyheder »

Tilmeld dig Version2's it-nyhedsbrev og vind en iPad mini.

Whitepapers

Version2 Insight: Bring Your Own Device (BYOD)

Mediehuset Ingeniøren

Version2 Insight: Business analytics

Mediehuset Ingeniøren

MobileTest Service – App Performance Evaluation

Testhuset

IT challenges in the mobile community

Interxion Danmark

Redpill Linpro Learning Management System

Redpill Linpro
  • Flere whitepapers

Branchenyheder

En ny epoke for storageløsninger!

HP

Sikkert, nemt og billigt at dele data

RushFiles

Anbragte unge jubler over bærbare

GlobalConnect

Talend - førende open source produkt - har fået dansk support

Viteco

Samarbejde med open-source softwareproducenten SUSE

Komplex IT

It-virksomheder

Credocom
|
Magirus Nordic
|
Rackhosting
|
Motus
|
KJAER DATA
|
Liga Distribution
|
A/S ScanNet
|
IT-Effect
|
It-globalview
|
d60
|
Visma
|
EMP Group
 

Information

  • Kontakt redaktionen
  • Job- og annoncesalg
  • Teknisk support
  • Om Version2
  • Brugerbetingelser
  • Cookie- & privatlivspolitik

Aktuelle emner

  • Business Intelligence
  • CSC-hacking
  • Cloud computing
  • Intranet
  • It-sikkerhed
  • NSA Prism
  • NemID
  • Open source CMS
  • Projektledelse
  • Scrum
  • Storage
  • Virtualisering
  • Windows 8
  • iOS 7

Tjenester

  • iPhone-app
  • RSS-feeds
Følg @version2dk
Tilmeld dig Version2's it-nyhedsbrev og vind en iPad mini.

Version2 udgives af

  • Mediehuset Ingeniøren A/S work Trekronergade 26 2500 Valby
  • Tlf. work 33265300