Keandalan
Memori Flash NAND memiliki beberapa masalah inheren yang terkait dengannya. Dua masalah terpenting meliputi terbatasnya harapan masa pakai karena sel Flash NAND mengalami keausan selama proses tulis yang berulang serta tingkat kesalahan yang terjadi secara alami.
Selama proses produksi Flash NAND, setiap potongan cetakan Flash NAND dari wafer silikon diuji dan ditandai dengan Rasio Kesalahan Bit (Bit Error Rate - BER atau RBER) kasar.
BER menetapkan tingkat terjadinya kesalahan bit secara alami pada Flash NAND tanpa bantuan dari Kode Koreksi Kesalahan (ECC) dan yang diperbaiki oleh Pengontrol SSD dengan menggunakan ECC Tingkat Lanjut yang berfungsi seketika atau on-the-fly (biasanya disebut BCH ECC, Strong ECC, atau koreksi kesalahan LDPC oleh berbagai produsen pengontrol SSD) tanpa mengganggu akses pengguna atau sistem.
Kemampuan pengontrol SSD untuk mengoreksi kesalahan bit tersebut dapat ditafsirkan melalui Rasio Kesalahan Bit Tak Terkoreksi (UBER - Uncorrectable Bit Error Ratio), yaitu “metrik tingkat kerusakan data yang sama dengan jumlah kesalahan data per pembacaan bit setelah penerapan metode koreksi kesalahan yang ditentukan”. {{Footnote.N48213}}
Sebagaimana ditetapkan dan distandardisasikan oleh asosiasi standar industri, JEDEC pada 2010 dengan dokumen JESD218A: Persyaratan dan Metode Uji Ketahanan Drive Solid State (SSD) serta JESD219: Beban Kerja Ketahanan Drive Solid State (SSD), SSD kelas enterprise dan kelas klien berbeda dalam berbagai aspek, yang meliputi, tetapi tidak terbatas pada, kemampuannya dalam mendukung beban kerja tulis yang lebih berat, kondisi lingkungan yang lebih ekstrem, serta pemulihan dari BER yang lebih tinggi dibandingkan dengan SSD klien. {{Footnote.N52081}}{{Footnote.N52082}}
Application Class | Beban Kerja (lihat JESD219) | Penggunaan Aktif (daya menyala) | Penggunaan Retensi (daya mati) | Persyaratan UBER |
Client |
Client |
40° C 8 jam/hari |
30° C 1 tahun |
≤10 -15 |
Enterprise |
Enterprise |
55° C 24 jam/hari |
40° C 3 bulan |
≤10 -16 |
Tabel 1 - JESD218A: Persyaratan dan Metode Pengujian Daya Tahan Solid State Drive (SSD)
Hak Cipta JEDEC. Diprokdusi ulang dengan perizinan JEDEC.
Dengan menggunakan persyaratan UBER yang diajukan JEDEC untuk perbandingan antara SSD enterprise dan klien, SSD kelas enterprise diharapkan hanya mengalami kesalahan 1 bit yang tak terpulihkan dengan rasio kesalahan 1 bit untuk setiap 10 kuadriliun bit (~1,11 Petabyte) dibandingkan dengan SSD klien yang rasio kesalahannya 1 bit untuk setiap 1 kuadriliun bit (~0,11 Petabyte) yang diproses.
SSD enterprise Kingston juga akan menambahkan teknologi tambahan yang akan memungkinkan pemulihan blok data yang rusak dengan menggunakan data paritas yang disimpan di cetakan NAND lainnya (seperti penerapan RAID pada drive sehingga pemulihan blok tertentu dapat disusun kembali dengan data paritas yang tersimpan di blok lainnya).
Untuk melengkapi teknologi pemulihan blok data redundan yang dibuat di dalam SSD enterprise Kingston, teknologi lainnya seperti pembuatan titik periksa (checkpoint) berkala, Pemeriksaan Redundansi Siklis (CRC - Cyclic Redundancy Check), dan koreksi kesalahan ECC juga diterapkan dalam skema perlindungan internal Ujung ke Ujung (End-to-End) guna menjamin integritas data dari host melalui flash dan kembali ke host. Perlindungan data Ujung ke Ujung berarti data yang diterima dari host diperiksa integritasnya pada saat disimpan di dalam cache internal SSD dan saat ditulis atau dibaca kembali dari area penyimpanan NAND.
Seperti halnya SSD kelas enterprise yang meningkatkan perlindungan ECC terhadap kesalahan bit, SSD juga dapat memuat sirkuit fisik untuk pendeteksian kehilangan daya yang mengelola kapasitor penyimpanan daya pada SSD. Dukungan Kegagalan Daya pada perangkat keras memantau daya yang masuk ke SSD dan pada saat terjadi kehilangan daya mendadak, sistem ini akan menyediakan daya sementara bagi sirkuit SSD dengan menggunakan kapasitor agar sistem dapat menyelesaikan setiap operasi tulis yang belum diselesaikan, baik yang berasal dari dalam maupun luar, sebelum mematikan daya SSD. Sirkuit Perlindungan Kehilangan Daya (PLP - Power Loss Protection) biasanya diperlukan untuk aplikasi yang tidak dapat memulihkan data yang hilang.
Perlindungan Kehilangan Daya juga dapat diterapkan pada firmware SSD dengan sering memindahkan semua data di area cache pengontrol SSD (misalnya, Tabel Lapisan Translasi Flash) ke penyimpanan NAND. Cara ini tidak menjamin data tidak akan hilang selama proses kehilangan daya, tetapi dapat meminimalkan dampak dari penghentian daya yang tidak aman. Perlindungan Kehilangan Daya Firmware juga memastikan agar SSD lebih tahan terhadap kerusakan setelah mengalami penghentian daya yang tidak aman.
Dalam banyak situasi, penggunaan Penyimpanan yang Ditentukan Perangkat Lunak (Software Defined Storage) atau pengklasteran server dapat mengurangi kebutuhan dukungan Kegagalan Daya berbasis perangkat keras karena semua data telah disalin ke perangkat penyimpanan yang terpisah dan independen di satu atau beberapa server lain. Pusat data berskala web sering kali menghilangkan dukungan Kegagalan Daya dengan menggunakan Penyimpanan yang Ditentukan Perangkat Lunak pada server RAID untuk menyimpan salinan redundan dari data yang sama.