
La formation d’un modèle de machine‑learning peut entraîner davantage de consommation de cycles du CPU, de mémoire et de bande passante d’E/S que toute autre tâche logicielle. Un seul et même‑modèle‑de‑pointe peut lire et écrire des centaines de téraoctets de données sur plusieurs époques, repoussant les limites même des baies de stockage les plus rapides. Avec la course à l’IA, où chaque secteur et chaque organisme gouvernemental rivalise pour repousser les limites des performances de cette technologie, il est devenu essentiel de disposer d’un moyen fiable et reproductible pour évaluer les ressources matérielles spécifiques aux charges de travail du machine learning. Le groupe MLCommons a été parmi les premiers à mener cette initiative avec MLPerf Storage v2.0, en proposant des méthodes innovantes pour évaluer les performances de stockage dans le cadre de la formation et de l’inférence du machine learning. Ce livre blanc analyse les performances des SSD DC3000ME PCIe Gen5 NVMe U.2 de Kingston dans le cadre du benchmark MLPerf, sans nécessiter de matériel GPU coûteux. À l’aide d’une émulation de veille, MLPerf simule des charges de travail IA réelles, permettant aux organisations de tester les performances de stockage de manière rentable et évolutive.
Pourquoi est-ce important ? Le stockage rapide permet de maintenir la productivité des GPU en acheminant les données rapidement, ce qui réduit les temps d’inactivité et optimise l’efficacité de calcul. Les SSD DC3000ME de Kingston aident les entreprises à accélérer les cycles de formation, à réduire les coûts d’infrastructure et à obtenir des performances évolutives avec moins d’unités, ce qui en fait un investissement judicieux pour les déploiements IA modernes.
Dans ce livre blanc, nous allons :
- Analyser la nouvelle méthode de test d’émulation de veille MLPerf v2 pour le stockage
- Présenter les différentes charges de travail de formation et de vérification couvertes par le stockage MLPerf v2
- Passer en revue les résultats obtenus par le DC3000ME Kingston dans les charges de travail de formation et de sauvegarde d’état sur les plateformes PCIe Gen5 et Gen4.
Les résultats montrent que les solutions NVMe PCIe Gen5 telles que le DC3000ME constituent une solution convaincante pour les organisations qui cherchent à optimiser l’utilisation des accélérateurs et les heures d’activité des GPU dans leurs workflows de machine learning. Nous examinons en détail les paramètres réglables, la méthodologie de test et le réglage post-mortem, ainsi que leur impact sur différentes charges de travail.
Les SSD DC3000ME NVMe PCIe Gen5 U.2 de Kingston constituent une solution très performante pour les charges de travail IA. Qu’il s’agisse de former des modèles d’apprentissage profond ou d’affiner des modèles linguistiques étendus, ces SSD offrent la vitesse, la fiabilité et l’efficacité nécessaires pour rester en tête dans la course à l’IA.
Télécharger le livre blanc