기업용 대 클라언트용 SSD

전문가가 왼쪽과 오른쪽을 가리키는 두 개의 흰색 화살표가 있는 벽을 마주하고 있습니다.

높은 데이터 처리량과 낮은 트랜잭션 지연 시간을 필요로 하는 데이터센터가 증가하면서 이전에는 서버의 하드 디스크 드라이브(HDD)에 의존했지만 이제는 성능 병목현상에 직면하고 있습니다. 이들은 데이터센터의 성능, 효율성, 안정성을 높이고 전체 운영 비용(OpEx)을 낮출 수 있는 솔루션으로 SSD(Solid-State Drive)를 찾고 있습니다.

SSD 등급 간의 차이점을 이해하기 위해 SSD의 두 가지 핵심 구성 요소인 플래시 스토리지 컨트롤러(또는 간단히 SSD 컨트롤러라고도 함)와 데이터 저장에 사용되는 비휘발성 NAND 플래시 메모리를 구분해 보겠습니다.

오늘날 업계에서, SSD 및 NAND 플래시 메모리 소비는 세 가지 주요 그룹으로 나뉩니다.
  • 소비자 장치(태블릿, 카메라, 휴대폰)
  • 고객 시스템(넷북, 노트북, 울트라북, AIO, 개인용 데스크탑 컴퓨터), 임베디드/산업용(게임 키오스크, 특수 설계 시스템, 디지털 옥외광고)
  • 기업용 컴퓨팅 플랫폼(HPC, 데이터센터 서버)

기업용 데이터센터에 적합한 SSD 스토리지 장치를 선택하려면 모든 SSD와 NAND 플래시 메모리가 동일하게 만들어지지 않았기 때문에 다양한 SSD 공급업체와 제품 유형을 학습하고 검증하는 길고 힘든 과정이 필요할 수 있습니다.

SSD는 HDD를 대체하거나 보완하는 용도로 쉽게 구축할 수 있도록 제조되며, 2.5인치, SATA(Serial ATA), SAS(Serial Attached SCSI), 최근에는 서버의 중앙처리장치(CPU)와 데이터를 주고받는 NVMe PCIe 등 다양한 폼 팩터와 통신 프로토콜/인터페이스로 제공됩니다.

그러나 쉽게 구축할 수 있다고 해서 모든 SSD가 장기적으로 선택한 기업용 애플리케이션에 적합하다는 보장은 없으며, 잘못된 SSD를 선택하면 과도한 쓰기로 인해 SSD가 조기에 소모되거나 예상 수명 동안 지속 쓰기 성능이 훨씬 낮거나 스토리지 어레이에 추가적인 지연 시간이 발생하여 조기 현장 교체가 필요할 때 초기 비용 절감 및 성능 이점이 무위로 돌아가는 경우가 종종 있습니다.

서버에 스토리지를 교체하거나 추가해야 할 때 올바른 구매 결정을 내리는 데 도움이 되도록 기업용 및 클라이언트급 SSD를 구분하는 세 가지 주요 특성에 대해 알아보겠습니다.

성능

SSD는 멀티채널 아키텍처와 SSD 컨트롤러에서 NAND 플래시 칩으로의 병렬 액세스를 통해 CPU의 순차 및 임의 데이터 요청 모두에 대해 매우 높은 읽기 및 쓰기 성능을 제공할 수 있습니다.

기술 CAD 도면 협업, 분석을 위한 지진 데이터(예: 빅데이터), 은행 거래를 위한 전 세계 고객 데이터 액세스(예: OLTP) 등 수백만 바이트의 무작위 회사 데이터를 처리하는 일반적인 데이터센터 시나리오에서 스토리지 장치는 최소한의 지연 시간으로 액세스할 수 있어야 하며, 많은 클라이언트가 동시에 동일한 데이터에 액세스해야 할 때 응답 시간의 저하 없이 액세스할 수 있어야 합니다. 사용자 경험은 짧은 지연 시간을 기반으로 하며, 이는 사용자 생산성 향상으로 이어집니다. 이를 전체 직원에게 적용하면 짧은 지연 시간의 이점이 얼마나 빠르게 누적되는지 알 수 있습니다.

클라이언트 애플리케이션은 사용자 또는 시스템 작업의 최소 응답 시간(또는 지연 시간)과 최대 응답 시간 사이의 허용 가능한 델타가 높은 단일 사용자 또는 애플리케이션 액세스만 포함합니다.

SSD를 사용하는 복잡한 스토리지 어레이(예: 네트워크 연결 스토리지, 직접 연결 스토리지 또는 저장 영역 네트워크)도 성능 불일치로 인해 부정적인 영향을 받으며 스토리지 어레이 지연 시간, 지속적인 성능 및 궁극적으로 사용자가 인식하는 서비스 품질에 혼란을 야기할 수 있습니다.

클라이언트 SSD와 달리, Kingston의 기업용 SSD는 접속 후 처음 몇 초 동안의 최고 성능에 최적화되어 있을 뿐만 아니라 더 큰 오버프로비저닝 영역(OP)을 사용해 더 오랜 기간 동안 더 높은 지속적 정상 상태 성능을 제공합니다. 특정 드라이브에 대한 자세한 정보는 Kingston 웹사이트의 기업용 SSD에서 확인할 수 있습니다.{{Footnote.N48213}}

이는 스토리지 어레이 성능이 최고 트래픽 부하 상태인 동안에도 조직이 기대하는 서비스 품질 (QoS)과 지속적으로 일관되도록 보장합니다.

서버룸의 랙 탑재 LED 콘솔.

신뢰성

NAND 플래시 메모리에는 몇 가지 본질적인 문제가 있습니다. 가장 중요한 두 가지 문제는 반복적인 쓰기 과정에서 NAND 플래시 셀이 소모됨에 따라 기대 수명이 유한하다는 점과 자연적으로 발생하는 오류율입니다.

NAND 플래시 생산 과정에서 실리콘 웨이퍼에서 절단된 각 NAND 플래시 다이를 테스트하고 원시 비트 오류율(BER 또는 RBER)로 특성화합니다.

BER은 NAND 플래시에서 자연적으로 발생하는 비트 오류가 오류 수정 코드(ECC)의 도움 없이 발생하는 속도를 정의하며, SSD 컨트롤러가 사용자 또는 시스템 액세스를 방해하지 않고 On-the-fly 지원 고급 ECC(일반적으로 SSD 컨트롤러 제조업체에 따라 BCH ECC, Strong ECC 또는 LDPC 오류 수정이라고 함)를 사용하여 수정하는 속도를 말합니다.

이러한 비트 오류를 수정하는 SSD 컨트롤러의 기능은 "특정 오류 수정 방법을 적용한 후 비트 읽기별 데이터 오류 수와 동등한 데이터 오류률의 메트릭"인 UBER(수정 불가 비트 오류율)로 해석할 수 있습니다.  {{Footnote.N48213}}

JESD218A:SSD(Solid State Drive) 요구사항 및 내구성 테스트 방법과 JESD219:SSD(Solid State Drive) 내구성 워크로드 문서에 따라 2010년 업계 표준 협회인 JEDEC 위원회에서 정의 및 표준화된 대로 기업용SSD는 수많은 방식으로 클라이언트급 SSD와 다르며 보다 많은 쓰기 워크로드, 보다 거친 환경 조건과 클라이언트 SSD보다 높은 BER의 복구를 지원하는 능력을 포함하되 이에 국한되지 않습니다.{{Footnote.N52081}}{{Footnote.N52082}}

응용 프로그램 클래스워크로드(JESD219 참조)사용 활성화(전원 켜기)사용 유지(전원 끄기)UBER 요건
고객 고객 40° C
8시간/일
30° C
1년
≤10 -15
기업용 기업용 55° C
24시간/일
40° C
3개월
≤10 -16

표 1 - JESD218A: SSD(Solid State Drive) 요건 및 내구성 테스트 방법
저작권 소유 JEDEC. JEDEC의 승인을 받아 복제됨.

JEDEC에 의해 제안된 UBER 요건을 사용해 기업용과 클라이언트급 SSD를 비교하면, 매 1,000조 비트(약 0.11페타바이트) 처리마다 1비트 오류의 클라이언트 SSD와 비교해 기업용 SSD는 매 10,000조 비트(약 1.11페타바이트) 처리마다 1비트 오류율로 1복구 불가 비트 오류만 예측됩니다.

Kingston의 기업용 SSD는 추가 기술을 더해 다른 NAND 다이에 보관된 패리티 데이터를 사용하여 데이터의 손상된 블록을 복구시킵니다(구성된 RAID 드라이브처럼 특정 블록을 복구해 다른 블록에 보관된 패리티 데이터를 재구축할 수 있음).

Kingston 기업용 SSD에 구축된 이중화 데이터 블록 복구 기술을 보완하기 위해, 정기적인 검사시점을 생성하고 CRC(Cyclic Redundancy Check) 및 ECC 오류 수정 또한 엔드 투 엔드 내부 보호 계획을 구현해 호스트에서 플래시로 그리고 다시 호스트로의 데이터 무결성을 보장합니다. 엔드투엔드 데이터 보호란 호스트에서 수신한 데이터가 SSD의 내부 캐시에 저장되는 동안과 NAND 스토리지 영역에서 쓰거나 다시 읽을 때 무결성을 검사하는 것을 의미합니다.

비트 오류에 대한 ECC 보호를 강화하는 기업용 SSD와 마찬가지로 SSD에는 SSD의 전력 스토리지 콘덴서를 관리하는 전력 손실 감지를 위한 물리적 회로가 포함될 수도 있습니다. 하드웨어의 전원 장애 지원은 SSD로 들어오는 전원을 모니터링하고, 갑작스러운 전원 손실이 발생하면 콘덴서를 사용하여 SSD 회로에 임시 전원을 공급하여 내부 또는 외부에서 발생한 미처리된 쓰기를 완료한 후 SSD의 전원을 차단합니다. 전력 손실 보호(PLP) 회로는 일반적으로 데이터 손실을 복구할 수 없는 애플리케이션에 필요합니다.

전력 손실 보호 기능은 SSD 컨트롤러의 캐시 영역(예: 플래시 변환 계층 테이블)에 있는 데이터를 NAND 스토리지로 자주 플러시하는 방식으로 SSD 펌웨어에 구현될 수도 있는데, 이는 전력 손실 이벤트 중에 데이터가 손실되지 않는다는 것을 보장하지는 않지만 안전하지 않은 전원 종료의 영향을 최소화하려고 시도합니다. 또한 펌웨어 전원 손실 보호 기능은 안전하지 않은 전원 종료가 발생한 후 SSD가 작동 불능 상태가 되는 것을 방지합니다.

다양한 여러 상황에서, 소프트웨어 정의 스토리지나 서버 클러스터를 사용하면, 어떠한 데이터라도 여러 서버에 있는 개별적이고 독립적인 스토리지 장치로 복제됨에 따라 하드웨어 기반의 전원 장애 지원에 대한 필요성을 줄일 수 있습니다. 웹 스케일 데이터 센터에서는 소프트웨어 정의 스토리지를 사용하여 동일한 데이터의 중복 복사본을 저장하기 위해 서버를 RAID로 구성하여 전원 장애 지원을 생략하는 경우가 많습니다.

내구성

시키는 데 사용할 수 있습니다(예비 블록 수가 많을수록). 전문가가 클라우드 컴퓨팅과 같은 기술 개념을 나타내는 기호가 있는 테셀레이션 육각형의 중첩된 그래픽에서 육각형을 누릅니다.

플래시 스토리지 장치에 있는 모든 NAND 플래시 메모리는 NAND 플래시 블록이 더 이상 저장된 데이터를 의존하지 않을 때까지 NAND 플래시 메모리 셀의 모든 프로그램 또는 지우기(P/E) 주기로 데이터 비트를 안정적으로 보관하는 기능을 저하시킵니다. 이 시점에, 기능이 저하된 블록이나 불량 블록이 사용자 주소 지정 가능 스토리지 풀에서 제거되고 논리적 주소 블록(LBA)이 NAND 플래시 스토리지 어레이상의 새로운 물리적 주소로 옮겨집니다. 새로운 스토리지 블록은 SSD의 오버 프로비저닝(OP) 스토리지의 일부인 예비 블록 풀을 사용해 불량 블록을 교체합니다.

셀이 일관적으로 프로그래밍되거나 지워지면서 BER 또한 선형으로 증가하게 되며 이것이 SSD의 예상 수명에 걸쳐 데이터를 안정적으로 보관하도록 셀 용량을 관리하기 위해 복잡한 관리 기술을 기업용 SSD 컨트롤러에 구현해야 하는 이유입니다.{{Footnote.N52083}}

해당 NAND 플래시 메모리의 P/E 내구성은 현재 리소그래피 제조 과정과 생성된 NAND 플래시 유형에 따라 상당히 달라질 수 있습니다.

NAND 플래시 메모리 유형QLCTLCMLCSLC
아키텍처 셀당 4비트 셀당 3비트 셀당 2비트 셀당 1비트
용량 최고 용량 더 높은 용량 대용량 최저 용량
내구성(P/E) 최저 내구성 낮은 내구성 중간 내구성 최고 내구성
비용 $ $$ $$$ $$$$
근사 NAND 비트 오류율(BER) 10^4 10^4 10^7 10^9

표 2 – NAND 플래시 메모리 유형 {{Footnote.N52084}}{{Footnote.N52085}}

기업용 SSD는 클라이언트 SSD 작동 주기에 따라서도 매우 달라집니다. 기업용 SSD는 일주일 중 매일 24시간 내내 데이터에 액세스해야 하는 데이터센터 서버의 일반적인 시나리오에서 과도한 읽기 또는 쓰기 작업을 견딜 수 있어야 합니다. 일반적으로 일주일 중 하루 8시간 동안만 완전히 활용되는 클라이언트급 SSD와 비교해보십시오.

기업용 SSD의 작동 주기는 24x7인데 반해 클라이언트 SSD는 20/80의 작동 주기(컴퓨터 사용 중 20%는 활성 상태, 80%는 유휴 또는 절전 모드)를 갖습니다.

애플리케이션 또는 SSD의 쓰기 내구성을 이해하는 것은 복잡할 수 있기 때문에 JEDEC 위원회에서는 SSD에 포함된 NAND 플래시가 신뢰할 수 없는 저장 매체가 되어 드라이브를 폐기해야 하기 전에 SSD에 기록할 수 있는 원시 호스트 데이터의 양을 나타내는 TBW(테라바이트 쓰기) 값을 사용하는 내구성 측정 메트릭을 제안하기도 했습니다.

JEDEC에서 제안한 JESD218A 테스트 방법과 JESD219 기업 등급 워크로드를 사용하면 TBW를 통해 SSD 제조업체의 내구성 계산을 해석하고 모든 데이터센터에 적용할 수 있는 보다 이해하기 쉬운 내구성 측정치를 추정하는 작업이 더 쉬워집니다.

문서 JESD218 및 JESD219에서 언급했듯이, 애플리케이션 등급 워크로드마다 호스트가 제출한 실제 쓰기보다 훨씬 높은 쓰기 증폭 계수(WAF)로 인해 문제가 발생할 수 있습니다. 이로 인해 관리할 수 없는 NAND 플래시 소모, 시간이 지남에 따라 과도한 쓰기로 인한 NAND 플래시 BER 증가, SSD 전체에 널리 분산된 유효하지 않은 페이지로 인한 성능 저하가 쉽게 발생할 수 있습니다.

TBW는 엔터프라이즈 및 클라이언트급 SSD를 논의할 때 중요한 주제이지만, TBW는 NAND 플래시 수준의 내구성 예측 모델일 뿐입니다. 장치에 사용되는 구성 요소의 신뢰성을 기반으로 한 구성 요소 수준의 내구성 및 신뢰성 예측 모델로서 평균 무고장 시간(MTBF)을 준수해야 합니다. 기업용 SSD 구성 요소에 대한 기대치에는 SSD의 기대 수명 기간 동안 모든 NAND 플래시 메모리의 전압을 더 오래 지속하고 더 열심히 관리하는 것이 포함됩니다. 모든 기업용 SSD는 최소 2백만 시간의 MTBF로 평가되어야 하며, 이는 230년 이상에 해당합니다! Kingston은 SSD를 매우 보수적으로 사양을 지정하며 SSD에서 더 높은 MTBF 사양을 보는 것은 드문 일이 아니므로, 기업용 SSD의 경우 2백만 시간은 충분한 시작점이라는 점에 유의하는 것이 중요합니다.

기업용 SSD에 대한 S.M.A.R.T. 모니터링 및 보고 기능을 사용하면 현재 쓰기 증폭 계수(WAF) 및 소모 수준을 기반으로 장치의 기대 수명에 대한 사전 장애를 쉽게 쿼리할 수 있습니다. 전원 손실, 물리적 인터페이스에서 발생하는 비트 오류 또는 고르지 않은 소모 분포와 같은 장애 이벤트에 대한 사전 장애 예측 경고도 지원되는 경우가 많습니다. Kingston SSD Manager 유틸리티는 Kingston 웹사이트에서 다운로드하여 드라이브의 상태를 확인하는 데 사용할 수 있습니다.

클라이언트 등급 SSD는 표준 사용 중 또는 장애 발생 후 SSD를 모니터링하기 위한 최소한의 S.M.A.R.T. 출력만 제공할 수 있습니다.

SSD의 애플리케이션 등급 및 용량에 따라, NAND 플래시 메모리의 예비 용량을 오버프로비저닝(OP) 예비 용량으로 할당할 수도 있습니다. OP 용량은 사용자 및 운영 체제 접근으로부터 숨겨집니다. 이 용량은 지속적인 성능 향상을 위한 임시 쓰기 버퍼로 활용하거나 SSD의 기대 수명 기간 동안 결함이 있는 플래시 메모리 셀을 교체하여 SSD의 안정성과 내구성을 향상

결론

기업용과 클라이언트급 SSD에는 NAND 플래시 메모리 프로그램 및 삭제 내구성부터 다양한 애플리케이션급 워크로드에 적합한 복잡한 관리 기법에 이르기까지 뚜렷한 차이점이 있습니다.

이러한 애플리케이션 등급의 차이를 이해하면 까다롭고 종종 미션 크리티컬한 기업 환경에서 가동 중단 시간의 위험을 최소화하고 관리하는 데 효과적인 도구가 될 수 있습니다.

추가 질문이 있거나 Kingston의 기업용 SSD에 대해 더 자세히 알고 싶으신 경우, Kingston 담당자, 전문가에게 묻기 팀 또는 기술 지원 채팅에 문의하십시오.

이 조치가 도움이 되었나요?

관련 영상

관련 기사