
Das Trainieren eines Maschinenlern-Modells kann mehr CPU-Zyklen, Speicher und E/A-Bandbreite verbrauchen als jede andere Softwareaufgabe. Ein einzelnes Modell auf den neuesten Stand der Technik kann Hunderte von Terabyte an Daten über mehrere Wochen hinweg lesen und schreiben und damit selbst die Grenzen der schnellsten Speicher-Arrays ausreizen. Mit dem Aufkommen des KI-Wettbewerbs, bei dem alle Branchen und Regierungsbehörden darum wetteifern, die Grenzen der KI-Leistung zu erweitern, ist der Bedarf an einer zuverlässigen, wiederholbaren Methode zum Benchmarking spezifischer Hardwareressourcen für Maschinenlernen-Workloads unverzichtbar geworden. Die MLCommons-Gruppe hat mit MLPerf Storage v2.0 Pionierarbeit geleistet und innovative Methoden zur Bewertung der Speicherleistung beim Training und der Inferenz im Bereich des maschinellen Lernens eingeführt. Dieses Whitepaper untersucht, was Kingstons DC3000ME PCIe Gen5 NVMe U.2 SSDs unter dem Benchmarking-Framework von MLPerf ohne teure GPU-Hardware leisten. Mithilfe von Schlaf-Emulation simuliert MLPerf reale KI-Workloads, damit Unternehmen die Speicherleistung auf kostengünstige und skalierbare Weise testen können.
Warum ist das wichtig? Schnelle Storage-Systeme sorgen für eine hohe Produktivität der GPUs, indem sie Daten schnell bereitstellt, Leerlaufzeiten minimiert und die Recheneffizienz maximiert. Kingstons DC3000ME-Laufwerke helfen Unternehmen dabei, Trainingszyklen zu beschleunigen, Infrastrukturkosten zu senken und mit weniger Laufwerken eine skalierbare Leistung zu erzielen. Damit sind sie eine intelligente Investition für moderne KI-Implementierungen.
In diesem Whitepaper:
- Untersuchen wir die neue MLPerf v2 Storage Schlaf-Emulationstestmethode
- Stellen wir die verschiedenen Trainings- und Checkpointing-Workloads vor, die von MLPerf v2 Storage abgedeckt werden
- Diskutieren wir die Ergebnisse der Anwendung der Kingston DC3000ME in den Trainings- und Checkpointing-Workloads auf PCIe Gen5- und Gen4-Plattformen
Die Ergebnisse zeigen, dass PCIe Gen5 NVMe-Lösungen wie die DC3000ME eine überzeugende Lösung für Unternehmen darstellen, die eine maximale Auslastung ihrer Beschleuniger und GPU-Betriebszeiten in ihren Machine-Learning-Workflows erzielen möchten. Wir befassen uns eingehend mit einstellbaren Systemen, Testmethodik und Post-Mortem-Tuning sowie deren Auswirkungen auf verschiedene Workloads.
Kingstons DC3000ME PCIe Gen5 NVMe U.2 SSDs sind eine leistungsstarke Lösung für KI-Workloads. Ganz gleich, ob Sie Deep-Learning-Modelle trainieren oder große Sprachmodelle feinabstimmen – diese Laufwerke bieten die Geschwindigkeit, Zuverlässigkeit und Effizienz, die Sie benötigen, um im KI-Wettlauf immer einen Schritt voraus zu sein.
Whitepaper herunterladen