標簽:服務器,人工智能,IBM,
IBM昨日(8月7日)發(fā)布了一項新技術,該技術可以通過應用大量強大的硬件來完成分布式深度學習(DDL)系統(tǒng)的訓練。它的工作原理是優(yōu)化運行深度神經(jīng)網(wǎng)絡的硬件組件之間的數(shù)據(jù)傳輸。
IBM試圖解決的關鍵問題是分布式深度學習系統(tǒng)中的網(wǎng)絡瓶頸問題。雖然有可能將計算負載分散到許多計算機上,但由于在實際計算中硬件之間的高延遲連接,這個過程會變得越來越低效。
PowerAI DDL是一種新的通信庫,它與一篇解釋性研究論文聯(lián)合發(fā)布,目的是為了提高效率,確保運行中的系統(tǒng)能夠充分利用所有可用的高性能連接。通過使用PowerAI DDL,IBM能夠在50分鐘內(nèi),使用64臺具有4個GPU的服務器,在ImageNet數(shù)據(jù)集上訓練流行的Resnet-50深度神經(jīng)網(wǎng)絡。
擁有足夠硬件的組織能夠充分利用PowerAI DDL的能力,可以明顯看到,數(shù)據(jù)科學家們等待實驗運行結果的時間會大大縮減。實驗運行得更快,科學家們就可以做更多實驗,也將會產(chǎn)生更好的結果。
IBM的通信庫正在作為其PowerAI軟件包的一部分發(fā)布,它允許數(shù)據(jù)科學家和工程師在該公司的高性能Power Systems服務器上執(zhí)行機器學習任務。為進行測試,該公司使用了64臺Power8 S822LC服務器,每臺都有4個Nvidia Tesla p100-sxm2 GPU。
這是套硬件很昂貴,但對于那些非常需要高性能人工智能計算而且不怕燒錢的企業(yè)來說,這算不了什么;蛟S,這可能正是醫(yī)療行業(yè)所需要的。
這項技術通過PowerAI發(fā)布,可以讓人們更容易地獲得IBM的研究成果,因為它與現(xiàn)有的一款軟件集成在一起,該軟件需在Power Systems硬件上運行。
不過,:IBM只是為自己的硬件發(fā)布了PowerAI DDL,且不會將系統(tǒng)的代碼作為開放源碼項目來使用,因此它無法在其他平臺上實現(xiàn)。
|