Zuverlässigkeit
NAND-Flashspeicher sind mit mehreren Problemen behaftet. Zu den beiden wichtigsten gehört die begrenzte Lebenserwartung, da NAND-Flashzellen während des wiederholten Schreibens verschleißen, sowie eine natürlich auftretende Fehlerquote.
Jeder NAND-Flash-Die wird während des Herstellungsprozesses eines NAND-Flashspeichers von Silizium-Wafers getestet und mit einer Bit-Rohfehlerrate (BER oder RBER) gekennzeichnet.
Die BER definiert die Rate, mit der normal auftretende Bitfehler im NAND-Flash ohne Ausgleich durch den Error Correction Code (ECC) vorkommen, und die der SSD Controller mit spontanem Advanced ECC (in der Regel BCH ECC-, Strong ECC- or LDPC-Fehlerkorrektur durch unterschiedliche SSD-Controller-Hersteller genannt) korrigiert, ohne den Anwender- oder Systemzugriff zu unterbrechen.
Die Fähigkeit des SSD Controllers, diese Bitfehler zu korrigieren, kann durch die Uncorrectable Bit Error Ratio (UBER), "eine Metrik für die Datenkorruptionsrate, die der Anzahl der Datenfehler pro Bit entspricht, die nach der Anwendung bestimmter Fehlerkorrekturverfahren gelesen wird", interpretiert werden.{{Footnote.N48213}}
Wie durch die Industry Standards Association JEDEC im Jahre 2010 mit Dokumenten JESD218A: Solid State Drive (SSD) Requirements and Endurance Test Method und JESD219: Solid State Drive (SSD) Endurance Workloads definiert und vereinheitlicht, unterscheidet sich die Enterprise-Klasse in einer Reihe von Möglichkeiten von SSDs der Client-Klasse, einschließlich, aber nicht beschränkt auf ihre Fähigkeit zur Unterstützung höherer Schreibauslastungen, extremerer Umgebungsbedingungen und Wiederherstellung einer höheren BER als ein Client-SSD.{{Footnote.N52081}}{{Footnote.N52082}}
Anwendungs klasse | Workload (siehe JESD219) | Aktive Nutzung (eingeschaltet) | Datenerhaltung (ausgeschaltet) | UBER-Anforderungen |
Client |
Client |
40° C 8 Stunden/Tag |
30° C 1 Jahr |
≤10 bis 15 |
Enterprise |
Enterprise |
55° C 24 Stunden/Tag |
40° C 3 Monate |
≤10 bis 16 |
Tabelle 1 - JESD218A: Solid-State-Drive (SSD) Requirements and Endurance Test Method
Urheberrecht JEDEC. Nachdruck mit freundlicher Genehmigung von JEDEC
Mit den von JEDEC vorgeschlagenen UBER-Vorgaben für SSDs der Enterprise-Klasse geht man bei einem Vergleich zwischen Enterprise-SSDs und Client-SSDs davon aus, dass bei einem Verhältnis von 1 Bitfehler je 10 Billiarden Bits (~ 1,11 Petabytes) nur 1 nicht behebbarer Bitfehler auftritt, im Gegensatz zu Client-SSDs, bei denen 1 Bitfehler je 1 Billiarde Bits (~ 0,11 Petabytes) verarbeitet wird.
Kingston Enterprise SSDs nutzen auch zusätzliche Technologien, mit denen die Wiederherstellung von beschädigten Datenblöcken mit Paritätsdaten, die in anderen NAND-Dies, gespeichert sind, möglich ist (ähnlich einer RAID-Konfiguration mit SSDs, bei der beschädigte Blöcke oder die ganze SSD mit Hilfe von Paritätsdaten von einer anderen SSD wiederhergestellt werden können).
Als Ergänzung zu den redundanten Datenblockwiederherstellungstechnologien, die in die Kingston Enterprise SSDs eingebaut sind, werden auch die Erstellung periodischer Kontrollpunkte und ein Cyclic Redundancy Check (CRC) als nahtloser interner Schutz implementiert, mit dem die Datenintegrität vom Host über den Flash und zurück zum Host garantiert werden kann. End-to-End-Datenschutz bedeutet, dass die vom Host empfangenen Daten während der Speicherung im internen SSD Cache und beim Schreiben oder Zurücklesen aus den NAND-Speicherbereichen auf ihre Integrität überprüft werden.
Wie SSDs der Unternehmensklasse, die den ECC-Schutz vor Bitfehlern verbessern, können SSDs auch physische Schaltkreise zur Erkennung von Stromausfällen umfassen, die die Stromspeicherkondensatoren auf den SSDs verwalten. Die hardwareseitige Power-Fail-Unterstützung überwacht die Stromzufuhr zur SSD und versorgt bei einem überraschenden Stromausfall die SSD-Schaltkreise mithilfe von Kondensatoren vorübergehend mit Strom, um alle intern oder extern ausgegebenen ausstehenden Schreibvorgänge abzuschließen, bevor die SSDs abgeschaltet werden. PLP-Schaltungen (Power Loss Protection / Schutz gegen Stromausfall) sind in der Regel für Anwendungen erforderlich, bei denen ein Datenverlust nicht wiederherstellbar ist.
Der Schutz gegen Stromausfall kann auch in der SSD-Firmware durch häufiges Entleeren von Daten in den SSD Controller-Cache-Bereichen (z. B. ihre Flash-Translation-Layer-Tabelle) an den NAND-Speicher implementiert werden. Dies gewährleistet zwar nicht, dass während eines Stromausfalls keine Daten verloren gehen, aber dadurch wird versucht, die Auswirkungen von unsicheren Stromabschaltungen zu minimieren. Firmwareseitiger Schutz gegen Stromausfall gewährleistet auch, dass es unwahrscheinlich ist, dass die SSD nach einer unsicheren Abschaltung nicht mehr betriebsfähig ist.
In vielen Situationen kann der Einsatz von Software Defined Storage oder Server-Clustering den Bedarf an hardwarebasiertem Power-Fail-Support senken, da alle Daten auf einem separaten und unabhängigen Speichergerät auf einem anderen Server oder anderen Servern repliziert werden. Web-Rechenzentren verzichten oft auf den Power-Fail-Support und verwenden Software Defined Storage für RAID-Server, um redundante Kopien derselben Daten zu speichern.