Deduplikacja

To nie kompresja a konsolidacja!

Deduplikacja to opatentowana przez NetApp technologia służąca do redukcji ilości danych przetrzymywanych na macierzy. Po uruchomieniu przeszukiwane są wszystkie dane i po znalezieniu identycznych, ich wielokrotność jest kasowana. Deduplikacja w NetApp działa na poziomie bloków (4 kb) a nie plików. Dla przykładu: nawet jeśli mamy na macierzy dwa pliki: jeden oryginalny, a drugi zmodyfikowany, to deduplikacja znajdzie wspólne fragmenty.

deduplikacji

Dzięki takiemu rozwiązaniu możemy zaoszczędzić sporo na koszcie zakupu dysków, gdyż nawet urządzenie mniejszej pojemności będzie mogło zapisać sporo danych.

Deduplikacja + wirtualizacja

Największe korzyści z deduplikacji uzyskujemy dla środowisk zwirtualizowanych. Np. w przypadku plików wirtualnych systemów VMware, wydajność deduplikacji sięga zwyczajowo 50-75%

wydajność deduplikacji

Czy są jakieś "ale"?

Oczywiście nie wszystkie dane dają się tak samo łatwo deduplikować. Np. dane uprzednio skompresowane - zip, rar - mają bardzo niski współczynnik deduplikacji. Podobnie jest w przypdaku zdjęć JPG, oraz plików wideo mpg, div-x itp. Najlepiej jednak wykonać samodzielnie testy na własnym środowisku aby przekonać się jaka będzie rzeczywisty zysk.

Warto również zobaczyć kalkulator deduplikacji aby samemu oszacować wydajność tego rozwiązania. Kolejnym rozwiązaniem pozwalającym efektywniej wykorzystywać pojemność macierzy jest kompresja danych.

0 komentarze

Please insert the result of the arithmetical operation from the following image:

Please insert the result of the arithmetical operation from this image. =

Uwaga: Pola z gwiazdką muszą być wypełnione