[리뷰] 초고속 SSD 시대에 동참하다, 크루셜 P1 SSD

강형석 redbk@itdonga.com

[IT동아 강형석 기자]

"우리는 더 많은 일반 소비자들에게 집중하고 싶다. 그런 점에서 NVMe 규격은 아직 시기상조라고 보고 있다. 물론 때가 온다면 뛰어난 성능과 최적의 가성비를 제공할 제품을 선보일 예정이다."

지난 1월, 기자는 조나단 위치(Jonathan Weehc) 마이크론 수석 제품 매니저와 존 탕기(Jon Tanguy) 마이크론 수석 SSD 제품 엔지니어와 함께 당시 선보일 신제품과 향후 출시될 제품에 대해 이야기를 나눴다. 그 자리에서 조나단 위치 매니저는 NVMe는 아직 시기상조이며, 때를 기다리고 있다고 말했다. 느낌만으로 보자면 당분간 NVMe 기반의 SSD를 하지 않을 것 같았다.

그리고 지금 기자 앞에는 마이크론이 빚은 M.2 인터페이스의 SSD가 놓여 있다. 이전처럼 으레 일반 SATA 기반 SSD겠거니 했지만 달랐다. 제품에 부착된 스티커 위에 선명하게 인쇄된 글자가 눈에 띄었다. 그렇다. ‘NVMe(Non-Volatile Memory express)’였다.

NVMe는 말 그대로 ‘비휘발성 메모리 전송’을 말한다. 낸드 플래시로 만들어진 SSD와 중앙처리장치(CPU)가 직접 빠르게 데이터를 서로 읽고 쓸 수 있도록 고안한 전용 통신 규격이다. 물론, 그냥은 안 된다. 대규모 데이터 송수신이 가능하고 낸드 플래시의 안정성을 유지하기 위한 전용 컨트롤러의 탑재도 필수다. 그렇기 때문에 현재 판매되는 대부분의 NVMe SSD의 가격이 높게 형성되어 있다.

마이크론 크루셜 P1 NVMe SSD.
마이크론 크루셜 P1 NVMe SSD.

하지만 마이크론은 달랐다. 그 동안 합리적 가격대의 SSD를 선보여 온 만큼, NVMe SSD 역시 합리적인 가격대를 형성하기 위해 오랜 시간 준비해 왔다. 그리고 지난 10월, 크루셜(Crucial) P1을 내놨다.

이 작은 NVMe SSD는 기존과는 다른 접근으로 합리적 가격대를 구현했다. 비밀은 낸드 플래시에 있다. 흔히 채택되는 TLC(Triple Level Cell)가 아니라 QLC(Quad Level Cell)를 사용한 것. 그만큼 하나의 낸드 플래시 모듈에 많은 데이터를 담아낼 수 있고, 자연스레 가격적 이점을 가져갈 수 있다. 하지만 초기의 TLC와 마찬가지로 QLC 역시 편견을 뛰어 넘어야 한다는 숙제를 함께 안게 되었다.

QLC 낸드 플래시로 구현한 NVMe SSD

본론으로 들어가자. 크루셜 P1에서 주목 받을 부분은 QLC 낸드 플래시. 앞서 언급한 것처럼 Quad Level Cell의 줄임말이다. 낸드 플래시는 SLC(Single Level Cell)부터 MLC(Multi Level Cell), TLC까지 이어졌고 이제 QLC 시대에 접어들었다. 이 셀은 데이터를 담는 공간을 의미한다. SLC는 1비트로 0과 1로 구성된 데이터 값을 담는다. 총 2개의 데이터를(2 x 1)을 담을 수 있는데, 수는 적지만 데이터를 가져오는 길이 적으니 그만큼 빠르게 대응 가능하다는 장점이 있다. 모듈(낸드 플래시)의 유지보수 측면에서도 유리하다.

고속 전송 인터페이스인 NVMe를 첫 도입한 크루셜. 최대 32Gbps 대역을 활용해 민첩한 성능을
낸다.
고속 전송 인터페이스인 NVMe를 첫 도입한 크루셜. 최대 32Gbps 대역을 활용해 민첩한 성능을 낸다.

MLC는 2비트로 00부터 11까지 총 4개의 데이터(2의 제곱)를 담게 되고, TLC는 3비트로 000부터 111까지 총 8개의 데이터(2의 3제곱)를 담는다. 점점 셀 안에 담는 데이터 양이 늘어나게 되면서 용량을 쉽게 늘릴 수 있게 되지만 반대로 컨트롤러가 하는 일은 많아졌다. 속도는 물론이고 이들의 수명을 지키기 위한 기술이 더 정교해져야 된다. 셀을 한 번 지워지고 쓸 때마다 수명이 줄어들기 때문.

QLC는 4비트로 0000부터 1111까지 총 16개의 데이터를 담는다. 같은 공간이어도 TLC의 2배 많은 용량 확보가 가능하다. 그러나 그만큼 컨트롤러의 역할이 더 중요해졌다. NVMe로 빠른 전송속도에 대응하면서 필요한 데이터는 즉시 불러오는 부담을 안게 되었으니 말이다.

실리콘모션의 SM2263EN 컨트롤러를
탑재했다.
실리콘모션의 SM2263EN 컨트롤러를 탑재했다.

컨트롤러는 실리콘모션(SiliconMotion)의 SM2263을 채택했다. 정확히는 SM2263EN 계열이다. PCI-Express 3.0 4레인 대응 SSD 컨트롤러로 4채널 전송이 가능하다. 1채널당 모듈 1개, 그러니까 최대 4개 모듈과 동시 통신이 가능하다는 이야기다. 이를 통해 최대 32Gbps(초당 4GB)까지 데이터 전송이 가능하다.

하지만 크루셜 P1은 SSD에 2개 낸드 플래시만 탑재된 상태. 때문에 2채널로 작동하게 된다. 개당 1초에 1GB 전송이 가능하므로 최대 초당 2GB 데이터 전송을 지원하는 구조다. 실제 제조사에서도 P1 1TB 제품 기준 최대 전송속도가 읽기 초당 2GB, 쓰기 1.75GB를 제시하고 있다.

많은 데이터 전송 통로를 활용하기 때문에 안정성을 위한 기술 확보는 필수적이다. 마이크론이 자체적으로 조율한 것도 있지만 이 컨트롤러 자체 기술로 본다면 안정성은 어느 정도 확보해 놓았다. 기본적으로 데이터 경로 보호를 위한 기술에 오류 보정 코드(ECC) 등이 적용됐다. AES 방식의 실시간 전체 드라이브 암호화, 하드웨어 안전 해시 알고리즘(SHA – Secure Hash Algorithm) 256 및 참난수 생성(TRNG – True Random Number Generator) 등도 지원한다.

NVMe 앞세운 성능 '평균 이상'

크루셜 P1 1TB NVMe SSD의 성능을 확인해 볼 차례. 성능 측정을 위해 9세대 인텔 코어 i9 9900K 프로세서와 에이수스 ROG 막시무스 XI 익스트림 메인보드 등으로 구성된 시스템에 장착했다. 간단한 파일 복사와 성능 측정 애플리케이션 등을 활용했다.

M.2 인터페이스를 지원하는 PC 혹은 노트북에 연결하면
된다.
M.2 인터페이스를 지원하는 PC 혹은 노트북에 연결하면 된다.

먼저 에이치튠(HDTune)을 통한 쓰기 측정을 실시했다. 저장장치의 속도를 그래프로 보여주는데 결과가 애플리케이션마다 다르므로 성능보다 그래프를 통해 제품 성향을 파악하는 것이 바람직하다. 이를 통해 본 P1은 쓰기 속도가 일정 수준을 유지하다, 600GB 구간에서 성능이 떨어지는 모습을 보여준다. 이는 성능을 구현하기 위한 기술이 적용되는 구간이 600GB까지라는 의미로 볼 수 있다.

크루셜 P1의 HDTune 쓰기 속도 측정
결과.
크루셜 P1의 HDTune 쓰기 속도 측정 결과.

흔히 MLC 이후 SSD들은 SLC 수준의 성능을 구현하기 위해 일부 잔여 공간을 합쳐 속도를 끌어내는 캐싱 기술을 도입하고 있다. 하지만 이것은 임시방편으로 꾸준히 SLC 수준의 성능을 내는 것은 아니다. 잔여 공간을 어떻게 활용하는가에 따라 다른데, 이 제품에서는 600GB 전후로 설정되어 있는 듯하다.

크루셜 P1의 HDTune 읽기 속도 측정
결과.
크루셜 P1의 HDTune 읽기 속도 측정 결과.

읽기 성능은 흥미롭다. 대체로 낮게 시작하다 후반으로 갈수록 상승, 유지되는 형태다. 대부분은 높게 시작해 낮아지거나 고성능 라인업이라면 꾸준히 유지되는 그래프인데, 이 제품은 그 반대다. 하지만 이 그래프 자체가 제품의 모든 것을 말해주는 것은 아니니 참고만 하자.

다른 속도 측정 애플리케이션의 그래프. 일부 구간에서 속도 저하는 있지만 대체로
안정적이다.
다른 속도 측정 애플리케이션의 그래프. 일부 구간에서 속도 저하는 있지만 대체로 안정적이다.

또 다른 저장장치 성능 측정 애플리케이션인 AS SSD 벤치마크의 결과를 보면 또 다르다. 쓰기는 15% 영역과 85% 구간에서 본연의 성능 50% 수준까지 떨어지다 이후 다시 복구되는 형태다. 이를 통해 성향을 유추해 보면 예비 공간을 다루는 구간보다는 컨트롤러의 기능이 아직 100% 구현되지 않았다는 쪽에 무게가 실린다. 차후 안정화를 위한 펌웨어에 주목하자.

읽기 성능은 고성능을 꾸준히 유지하다 90% 구간에서 크게 떨어진다. 이는 데이터가 가득 찼을 때 성능 저하를 의미할 수도 있다. 1TB라는 용량이 크다면 크고, 작다면 작다.

크루셜 P1의 크리스탈 디스크 마크 속도 측정
결과.
크루셜 P1의 크리스탈 디스크 마크 속도 측정 결과.

성능 측정 도구인 크리스탈 디스크 마크를 통해 속도를 측정하니, 사양에 근접한 모습을 보여준다. 순차 읽기는 초당 2GB, 쓰기는 1.6GB 이상을 기록했다. NVMe 특유의 성향을 잘 보여준다고 볼 수 있겠다. 물론 고성능 제품에 비하면 약 70~80% 수준의 성능인데, 사실 이 정도만 해도 PC의 성능을 최대한 끌어내는데 어려움이 없다.

무작위 읽기/쓰기(4K QD8T8) 속도도 만족스러운 수준이다. 읽기가 초당 697MB, 쓰기가 초당 284.8MB를 기록했다. 초당입출력(IOPS)으로 계산해 보면 읽기가 약 17만 8,000 IOPS, 쓰기 약 7만 3,000 IOPS 수준이다. 제조사가 제시한 기준으로 보면 읽기는 충족하지만 쓰기 성능은 많이 부족해 보인다.

AS SSD 벤치마크 측정 결과.
AS SSD 벤치마크 측정 결과.

하지만 AS SSD 벤치마크의 무작위 읽기/쓰기(4K-64스레드) 항목을 보면 읽기 16만 8,925 IOPS, 쓰기 24만 642 IOPS를 기록했다. 성능 측정 애플리케이션마다 편차가 크게 나타난다. 앞서 언급했던 것처럼 각 애플리케이션의 결과는 각각 다르므로 성향에 대한 참고만 하는 것이 바람직하다.

파일 복사 성능도 인상적이다. 속도 측정을 위해 준비한 파일 3개(1GB, 4GB, 10GB)를 샌디스크 울트라 1TB SATA SSD에서 크루셜 P1으로 복사를 시도했는데, 1GB는 복사 명령을 하자마자 마무리 지을 정도로 빠르다. 이어 4GB는 약 5초, 10GB는 12초 정도면 복사가 마무리 되었다. 하드디스크라면 이보다 적어도 5배 가량은 느렸을 것이다. 기술의 발전이 실감나는 순간이다.

합리적인 가격에 대용량을 경험한다

온라인 기준 크루셜 P1의 최저가는 1TB가 약 29만 원대. 1GB당 300원 조금 안 되는 수준이다. 100% 동일하게 비교할 수 없겠지만 동일한 용량의 NVMe SSD가 대체로 35~70만 원을 상회한다는 점을 감안하면 합리적인 수준이라 봐도 무방하다. 일부 1TB NVMe SSD가 이 제품보다 저렴한 것이 있는데 살펴보면 PCI-Express 레인을 2개만 쓴다거나(대역폭 16Gbps), 컨트롤러가 하위 제품을 채택하는 등 차이가 존재한다.

성능이나 성향을 보면 약간 아쉬운 부분도 없지 않지만 아직 출시 초기이기에 펌웨어로 보완될 여지는 충분히 남아 있다. 이를 어떻게 다듬어가는가 여부는 마이크론에 달려 있다. 새로운 낸드 플래시를 적용한 사례가 많지 않기 때문에 마이크론이 짊어진 짐은 의외로 무거울 것이다. 하지만 시대는 변한다. 저장장치도 마찬가지다. 언젠가 경험해야 할 일이었다. 다만 크루셜 P1이 그 총대를 빨리 짊어 졌을 뿐이다.

글 / IT동아 강형석 (redbk@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.