
El entrenamiento de un modelo de aprendizaje‑automático puede consumir más ciclos de CPU, memoria y ancho de banda de E/S que cualquier otra tarea de software. Un único modelodevanguardia puede leer y escribir cientos de terabytes de datos en múltiples épocas, superando los límites de las matrices de almacenamiento más rápidas. Con el surgimiento de la carrera de la IA, a medida que todas las industrias y agencias gubernamentales compiten para superar los límites del rendimiento de la IA, la necesidad de una forma confiable y repetible de comparar recursos de hardware específicos para las cargas de trabajo de ML (Machine learning o aprendizaje automático) se ha vuelto esencial. El grupo MLCommons ha sido pionero en este esfuerzo con MLPerf Storage v2.0, introduciendo métodos innovadores para evaluar el rendimiento del almacenamiento en el entrenamiento e inferencia del aprendizaje automático. Este documento técnico explora el rendimiento de los SSD Kingston DC3000ME PCIe Gen5 NVMe U.2 bajo el marco de evaluación comparativa del MLPerf sin requerir un costoso hardware de GPU. Al utilizar la emulación de suspensión, MLPerf simula las cargas de trabajo de IA del mundo real, lo que permite a las organizaciones probar el rendimiento del almacenamiento de una manera rentable y escalable.
¿Por qué esto es importante? El almacenamiento rápido mantiene la productividad de las GPU al alimentar los datos rápidamente, minimizando el tiempo de inactividad y maximizando la eficiencia informática. Las unidades Kingston DC3000ME ayudan a las organizaciones a acelerar los ciclos de capacitación, reducir los costos de infraestructura y lograr un rendimiento escalable con menos unidades, lo que las convierte en una inversión inteligente para las implementaciones modernas de IA.
En este informe, nosotros:
- Examinamos el novedoso método de prueba de emulación de suspensión de almacenamiento MLPerf v2.
- Presentamos las diferentes cargas de trabajo de entrenamiento y comprobación cubiertas por el almacenamiento de MLPerf v2
- Analizamos los resultados obtenidos por Kingston DC3000ME en las cargas de trabajo de entrenamiento y comprobación en plataformas PCIe Gen5 y Gen4.
Los resultados muestran que las soluciones PCIe Gen5 NVMe como DC3000ME presentan una solución convincente para las organizaciones que buscan lograr la mayor utilización del acelerador y las horas activas de la GPU en sus flujos de trabajo de aprendizaje automático. Profundizamos en los ajustes, la metodología de pruebas y el ajuste post mortem, así como en su impacto en diferentes cargas de trabajo.
Los SSD Kingston DC3000ME PCIe Gen5 NVMe U.2 son una solución de alto impacto para cargas de trabajo de IA. Ya sea que esté entrenando modelos de aprendizaje profundo o afinando grandes modelos de lenguaje, estas unidades brindan la velocidad, confiabilidad y eficiencia necesarias para mantenerse a la vanguardia en la carrera de la IA.
Descargar documento técnico