NAS라면 필수? 저장장치 고장 극복하는 RAID 기술 이모저모
[IT동아 김영우 기자] 현대 사회에서 데이터는 곧 경쟁력이다. 유용한 데이터를 최대한 많이 보유하고 있어야, 그리고 이러한 데이터를 자유롭게 이용할 수 있어야 경쟁에서 앞서 나갈 수 있다. 네트워크를 통해 언제 어디서나 자신의 데이터에 접속할 수 있는 클라우드 서비스가 인기를 끄는 것 역시 이런 이유 때문이다.
이러한 흐름을 타고 NAS(Network Attached Storage)를 이용자가 늘어나고 있다. 이는 네트워크 접속 기능을 갖춘 저장장치의 일종으로, 사용자가 자유롭게 HDD나 SSD를 꽂아 용량을 설정할 수 있다. 맘만 먹으면 수십 TB용량을 저장할 수 있는 자신만의 클라우드 공간을 구축할 수 있다는 의미다. 제품을 구매해서 인터넷에 연결하기만 하면 되므로 추가적인 서비스 이용 요금이 들지도 않는다.
< 시놀로지의 2베이 NAS인 DS718+>
다만 데이터 저장소는 용량이나 편의성도 중요하지만 그 이상으로 중요한 것이 안정성이다. HDD나 SSD는 오래 이용하다 보면 고장 나서 귀중한 자료를 잃어버릴 수도 있다. 그래서 시중에 팔리는 대부분의 NAS는 복수의 저장장치에 데이터를 분산 저장하는 RAID(Redundant Array of Inexpensive/Independent Disk) 기술을 지원한다. 이를 통해 장애가 발생하더라도 데이터의 유실을 방지할 수 있다.
< 4대의 저장장치를 탑재할 수 있는 시놀로지 DS420j>
RAID를 이용하려면 해당 장치가 최소한 2개 이상의 드라이브 베이를 갖추고 있어야 한다. 시중에 팔리는 대부분의 NAS가 2베이 이상인 것도 이런 이유다. 그리고 상위 제품의 경우는 4베이 이상의 구성을 지원하기도 하는데, 더 많은 HDD나 SSD를 꽂을 수 있으면 색다른 방식의 RAID를 구성해 보다 다양한 상황에 대응할 수 있다. 참고로 RAID 구성은 PC에서도 가능은 하지만 이보다는 NAS 등의 서버 기기에서 이용하는 것이 일반적이다.
시놀로지 NAS를 이용한 저장장치 RAID 구성
그렇다면 NAS에서 RAID는 어떻게 구성하는 것이며 각 RAID 구성은 어떤 특성을 가지고 있는지 알아보자. 이번 기사에선 가정용 및 중소기업용으로 선호도가 높은 시놀로지(Synology)의 NAS, 그 중에서도 DS420j를 이용했다. 이 제품은 시놀로지의 NAS 제품군 중에서도 저렴한 입문자용에 속하는 j 시리즈이면서 4개의 드라이브 베이를 갖춘 것이 특징이다.
< 시놀로지 DS420j에 HDD를 탑재하는 모습>
시놀로지 NAS에 HDD나 SSD를 꽂고 네트워크 및 전원 케이블을 연결한 후 전원을 켜면 초기 설치 과정이 시작된다. 이 과정에서 어떤 RAID 구성을 할지도 선택할 수 있는데, 각 RAID 구성의 특징은 이하와 같다. 참고로 RAID 구성에 쓰이는 HDD나 SSD는 되도록 동일한 모델로 하는 것이 안정성이나 효율성 면에서 유리하다. 만약 각 저장장치의 제조사가 다르더라도 용량은 같은 것으로 맞추는 것을 추천한다.
1) RAID 0 – 용량과 성능 면에서 유리하지만 안정성은 떨어져
: 2대 이상의 저장장치를 쓰면서 하나의 저장소 볼륨을 구성할 수 있다. 이를테면 10TB HDD 2대를 묶어 20TB HDD 1대처럼 쓸 수 있다. 그리고 하나의 데이터를 쪼개서 각 저장장치로 나누어 저장한다. 단순하게 설명한다면 만약 2개의 HDD로 RAID 0를 구성한 상태에서 100MB 파일 1개를 복사한다면 각 HDD에 50MB만 저장하는 식이다.
이렇게 하면 1개의 저장장치를 쓰는 상태에 비해 빠르게 데이터의 읽기나 쓰기가 가능하며, HDD의 수를 늘린다면 그만큼 더 나은 속도를 기대할 수 있다. 다만 모든 데이터를 각 저장장치로 쪼개어 저장하므로 하나의 저장장치라도 고장 난다면 모든 데이터를 쓸 수 없게 된다. 안정성을 희생해 성능을 극대화하는 방식이라 할 수 있는데, 데이터 보존 능력이 중요한 NAS에선 그다지 추천할 수 없다.
2) RAID 1 – 용량면에서 손해 크지만 오로지 안정성만을 추구
: 이 역시 2대 이상의 저장장치만 있으면 구성할 수 있다. 하나의 데이터를 쪼개서 저장하는 RAID 0와 달리, 각 저장장치에 완전한 데이터를 동일하게 저장한다. 이렇게 하면 일부 저장장치가 고장 나더라도 단 1개의 저장장치만 살아 있다면 모든 데이터를 온전하게 살릴 수 있다.
다만, 이렇게 하면 성능 면에서는 아무런 이득이 없으며 용량 면에서 특히 손해가 많다. 예를 들어 10TB 용량의 HDD 10개를 쓴다 하더라도 RAID 1 구성이라면 운영체제에서는 이를 10TB 용량의 디스크 1개로만 인식하기 때문이다. 하지만 이 상태에서는 10개의 HDD 중 9개가 고장 나더라도 데이터 손실은 없다. 오로지 안정성만을 극단적으로 추구하는 방식이라 할 수 있다. 2베이 NAS에서 가장 일반적으로 많이 적용하는 RAID 규격이기도 하다.
3) RAID 5 – 안정성과 용량의 조화를 이룬 방식
: 최소 3개의 저장장치가 필요한 구성이다. 각 저장장지에 데이터를 쪼개서 저장해 성능을 높인다는 점은 RAID 0와 유사하지만, 본 데이터 외에도 각 파일의 원래 형태를 복구할 수 있는 패리티(parity) 정보를 함께 생성해 각 저장장치에 번갈아 저장하는 것이 다르다. 이렇게 하면 RAID를 구성하고 있는 저장장치 중 하나가 고장 나더라도 다른 저장장치에 있는 패리티 정보를 바탕으로 데이터를 복구할 수 있게 된다(다만, 2개 이상이 고장 날 경우에는 데이터를 복구할 수 없다).
이렇게 하면 본 데이터 외에도 패리티 정보를 저장해야 하는 공간이 저장장치 1개만큼(각 저장장치의 용량이 모두 같다고 가정) 더 필요하다. 예를 들어 10TB HDD 6대로 RAID 5를 구성한다면 실제 저장 공간은 60TB가 아닌 50TB가 된다. RAID 5는 성능과 안정성을 동시에 추구할 수 있으면서 RAID 1에 비해 용량 낭비를 줄일 수 있어 3베이 이상의 NAS에서 일반적으로 많이 적용하는 구성이다.
4) RAID 6 – RAID 5와 유사하지만 용량보다 안전성에 좀 더 비중
: RAID 6는 RAID 5와 거의 유사한 방식이다. 하지만 RAID 5에 비해 한 세트의 패리티 정보를 더 저장하므로 상대적으로 안정성이 더 높다. 덕분에 RAID 5은 1개의 저장장치 고장에만 대응할 수 있지만 RAID 6는 2개의 저장장치가 고장 나도 데이터 복구가 가능하다.
패리티 정보량이 늘어난 만큼 RAID 5에 비해 1대의 저장장치가 더 필요하다. 따라서 최소 4대의 저장장치가 있어야 RAID 6 구성이 가능하다. 그리고 당연히 사용자가 데이터를 저장할 수 있는 용량은 전체 저장장치의 총 용량에서 2대 분량만큼 줄어든다. 이를테면 10TB HDD 6대를 쓰더라도 RAID 6 구성을 하면 총 가용용량은 60TB가 아닌 40TB가 되는 셈이다. RAID 6는 RAID 5와 유사점이 많지만 용량보다는 안정성에 조금 더 비중을 둔 구성이다.
5) RAID 10 – 성능과 안정성의 동시 추구, 용량 면에선 다소 손해
: 두 개의 저장장치를 RAID 1로 구성 뒤 이를 다시 각각 RAID 0로 묶는 방식이다. RAID 1+0이라 부르기도 한다. 따라서 최소 4개의 저장장치가 필요하다. RAID 1의 안정성과 RAID 0의 성능을 동시에 추구할 수 있다는 이점이 있다. 어찌 보면 가장 이상적인 RAID 방식이지만 사용할 수 있는 용량이 무조건 전체 저장장치 용량의 절반이 되며, 반드시 2개, 4개, 8개와 같이 저장장치의 수가 짝수여야 구성이 가능하다는 제한이 있다.
RAID 구성의 대략은 위와 같다. 만약 이것이 너무 복잡하다고 생각된다면 시놀로지 NAS의 초기 설정 시 'SHR(Synology Hybrid RAID)'를 선택하자. 이렇게 하면 프로그램에서 현재 NAS에 탑재된 저장장치의 수와 용량을 분석해 가장 적절한 방식으로 RAID를 자동 구성하게 된다. 그리고 NAS 초기 설정을 이미 마친 후에도 시놀로지 NAS 전용 운영체제인 DSM(DiskStation Manager) 내에서 제공하는 저장소 관리자 기능을 통해 새로운 저장장치나 기존 저장장치의 RAID 구성을 재설정 하는 것이 가능하니 참고하자.
글 / IT동아 김영우(pengo@itdonga.com)