
Pelatihan model pembelajaran mesin (machine learning) dapat menghabiskan lebih banyak siklus CPU, memori, dan bandwidth I/O daripada semua tugas perangkat lunak lainnya. Satu model mutakhir tunggal dapat membaca dan menulis ratusan terabita data dalam beberapa epoch (putaran pelatihan), sehingga mendorong batas kinerja perangkat bahkan array penyimpanan tercepat sekalipun. Dengan munculnya perlombaan teknologi AI seiring ketatnya persaingan antara setiap industri dan lembaga pemerintah dalam meningkatkan kinerja AI, kebutuhan akan cara yang andal dan dapat diulang untuk menetapkan tolok ukur sumber daya perangkat keras tertentu bagi beban kerja ML (pembelajaran mesin) menjadi sangat penting. Grup MLCommons telah memelopori upaya ini dengan MLPerf Storage v2.0, yang memperkenalkan metode inovatif untuk mengevaluasi kinerja penyimpanan dalam proses pelatihan dan inferensi pembelajaran mesin. Laporan resmi ini membahas kinerja SSD DC3000ME PCIe Gen5 NVMe U.2 dari Kingston dalam kerangka kerja pengukuran tolok ukur MLPerf tanpa memerlukan perangkat keras GPU yang mahal. Dengan menggunakan emulasi sleep (tidur), MLPerf menyimulasikan beban kerja AI dunia nyata sehingga organisasi dapat menguji kinerja penyimpanan dengan cara yang hemat biaya dan dapat diskalakan.
Mengapa hal ini penting? Penyimpanan berkecepatan tinggi menjaga produktivitas GPU dengan mengalirkan data secara cepat, meminimalkan waktu idle, serta memaksimalkan efisiensi komputasi. Drive DC3000ME Kingston membantu organisasi mempercepat siklus pelatihan, mengurangi biaya infrastruktur, dan mencapai kinerja yang dapat diskalakan dengan jumlah drive lebih sedikit sehingga menjadikannya investasi cerdas untuk penerapan AI modern.
Dalam laporan resmi ini, kami melakukan hal berikut:
- Meninjau metode uji emulasi sleep yang baru pada MLPerf Storage v2
- Memperkenalkan berbagai beban kerja pelatihan dan checkpointing (penyimpanan status/titik sementara) yang dicakup oleh MLPerf Storage v2
- Membahas hasil pengujian DC300ME Kingston pada beban kerja pelatihan dan checkpointing di platform PCIe Gen5 dan Gen4.
Hasil pengujian menunjukkan bahwa solusi PCIe Gen5 NVMe seperti DC3000ME memberikan solusi yang menarik bagi organisasi yang ingin memaksimalkan pemanfaatan akselerator dan jam aktif GPU dalam alur kerja pembelajaran mesinnya. Kami membahas secara mendalam tentang parameter yang dapat disesuaikan, metodologi uji, serta penyetelan pasca pengujian dan dampaknya terhadap beban kerja yang berbeda.
SSD DC3000ME PCIe Gen5 NVMe U.2 Kingston adalah solusi berdampak tinggi untuk beban kerja AI. Baik saat Anda melatih model deep learning (pembelajaran mendalam) maupun menyempurnakan model bahasa berskala besar (LLM), drive ini memberikan kecepatan, keandalan, dan efisiensi yang dibutuhkan untuk tetap unggul dalam perlombaan AI.
Unduh laporan resmi