Rodzaje RAID
Obecenie produkowane urządzenia wyposażone są często w różnorakie systemy RAID. Który z nich jest najlepszy, najszybszy, na co zwrócić uwagę?
RAID (ang. Redundant Array of Independent Disks, Nadmiarowa macierz niezależnych dysków) – polega na współpracy dwóch lub więcej dysków twardych w taki sposób, aby zapewnić dodatkowe możliwości, nieosiągalne przy użyciu jednego dysku jak i kilku dysków podłączonych indywidualnie.
RAID używa w celu:
- zwiększenia niezawodności (odporność na awarie),
- zwiększenia wydajności transmisji danych,
- powiększenia przestrzeni dostępnej jako jedna całość.
Przyjrzyjmy się bliżej najpopularniejszym standardom:
RAID 0
Jest to tzw. stripe. Dane zapisywane są na kilku dyskach, np. pierwszy blok na pierwszym dysku, drugi na drugim itd. Dzięki temu uzyskujemy znaczne przyspieszenie operacji odczytu i zapisu. Wadą tego systemu jest brak odporności na awarię. Jeśli dowolny dysk ulegnie uszkodzeniu, to najczęściej tracimy wszystkie dane, gdyż każdy dysk zawiera tylko część danych.
RAID 1
Jest to tzw. mirroring (lustro). Czyli połowa dysków zawiera dane a druga połowa jest ich dokładną kopią. W tym przypadku jesteśmy zabezpieczeni na awarię każdego z dysków, jednakże tracimy 50% całkowitej pojemności.
Przykład: dwa dyski, każdy o pojemności 1 TB połączone razem w RAID1, mają łączną pojemność 1 TB (drugi zawiera to samo co pierwszy).
RAID 10
To połączenie RAID 0 z RAID 1, nazywany również RAID 1+0. W tym przypadku dane są zapisywane na połowie dysków jako stripe(RAID-0), a druga połowa jest ich lustrzaną kopią (RAID-1) – mirroring.
Jesteśmy odporni na awarię jednego dysku lub nawet dwóch, ale nie dowolnych dwóch.
Należy jednak pamiętać, iż w przypadku awarii dysku i jego lustrzanej kopii (mirroru), wszystkie dane zostaną utracone. Z tego względu w macierzach NetApp serii FAS używany jest RAID-DP jako alternatywa dla RAID-10.
RAID 4
W RAID 4 dane zapisywane są na kilku dyskach, a dodatkowo na osobnym dysku są umieszczne sumy kontrolne, które w przypadku awarii jednego z dysków umożliwiają jego odtworzenie poprzez wykonanie określonych operacji matematycznych.
RAID 5
W przypadku RAID-5 dane są również zapisane na wszystkich dostępnych dyskach, tak jak ma to miejsce w przypadku RAID4. Z tą różnicą jednak, że częściowe sumy kontrolne są rozłożone na wszystkie dyski.
Takie rozwiązanie ma jednak zasadniczą wadę. Po awarii jednego z dysków, macierz musi odbudować sumy kontrolne, obciążając mocno system. Drugi aspekt to rozbudowa – jeśli chcemy dołożyć do istniejącego systemu dodatkowy dysk, cała macierz musi zostać przebudowana.
RAID-5 jest odporny na awarię wyłączenie jednego dysku.
RAID DP
Jest to opatentowany przez firmę NetApp system RAID, który charakteryzuje się odpornością na awarię dwóch dowolnych dysków (DP – Dual Parity). Jest to modyfikacja RAID 4, z tą różnicą, że zamiast jednego mamy do dyspozycji dwa dyski parzystości, każdy w inny sposób przelicza sumy kontrolne.
Na poniższym schemacie A,B,C to dyski z danymi, natomiast P oraz Q to sumy kontrolne.
DDP
DDP (Dynamic Disk Pool) – jest nowatorskim systemem RAID dostępnym w urządzeniach NetApp serii E. Więcej o DDP w osobnym artykule.
JBOD
Warto również wspomnieć o pojęciu JBOD (ang. Just a Bunch Of Disks). Jest to zwykłe połączenie dysków, bez użycia technologii RAID. JBOD, w przeciwieństwie do RAID, nie daje korzyści w postaci przyspieszenia operacji zapisu/odczytu czy zwiększenia bezpieczeństwa danych.
Które rozwiązanie wybrać?
Odpowiedź na to pytanie z pewnością nie jest jednoznaczna. Każde rozwiązanie ma swoje zalety i wady a wybór jednego z nich to zawsze kompromis między: szybkością działania, bezpieczeństwem i ilością dostępnej rzeczywistej przestrzeni dyskowej.
Z uwagi na fakt, iż ani RAID-10 ani RAID-5 nie oferuje odporności na awarię dowolnych dwóch dysków, w macierzach NetApp serii FAS zrezygnowano z implementacji tych systemów. Jeśli jednak zależy nam koniecznie na mirroringu danych, zamiast RAID-10 możemy użyć technologii SyncMirror opisanej szczegółowo tutaj