鎧俠SAS口 PX04S SSD

三星PCIe卡983ZET

英特爾傲騰900P

測試中分析了機器學習在訓練階段的性能表現(xiàn),測試程序用的是byteLAKE的EWA Gurad,它是一個實時監(jiān)測模型,該模型包括一個輸入層,22個卷積層,5個池化層,2個路由層,還有一個探測層。

測試優(yōu)劣的評判標準是時間,就是做5000個Epoch所耗費的時間,每換一次SSD就進行一次測試,測試結果如下。

明顯可見,本地的SSD對性能幾乎沒有影響,換了不同性能的SSD,既有SAS口的,也有PCIe口的,既有NAND SSD也有機遇3D Xpoint的SSD,最終性能表現(xiàn)都差不多。

在數(shù)據(jù)的獲取時,SSD會有優(yōu)勢,但在計算環(huán)節(jié),對SSD的要求并不高,那是不是說明CPU的訓練能力不夠,導致瓶頸呢?

為了進一步測試,在服務器里加入來了一塊英偉達T4顯卡,然后再跑一下測試。

GPU的加速效果還是非常明顯的,提升了22倍,計算性能提升來的話,SSD的性能差異是否明顯呢?從數(shù)據(jù)來看,顯然還是沒什么影響。

測試結果發(fā)現(xiàn),高性能的存儲并沒有提升AI訓練階段的性能,由于AI模型的復雜結構限制,機器學習訓練的時間要遠遠高于數(shù)據(jù)載入的時間。雖然英偉達T4顯卡加速了機器學習的速度,但并沒有讓SSD發(fā)揮優(yōu)勢,

當然,想要看具體某個零部件對于系統(tǒng)性能影響的話還需要許多細致的工作,比如,換一個AI框架,換別的零部件什么的。這一測試其實是有意義的,可以讓我們找出有利于性能提升的部分,把錢花在刀刃上。

分享到

zhupb

相關推薦