-
華為Atlas 900 AI訓(xùn)練集群超強(qiáng)算力解析
最后更新: 2019-09-18 10:39:23(觀察者網(wǎng)訊)
9月18日,華為全聯(lián)接2019(HUAWEI CONNECT)大會(huì)上,華為副董事長胡厚崑發(fā)布了Atlas 900 AI訓(xùn)練集群,以超強(qiáng)算力帶給企業(yè)人工智能業(yè)務(wù)的極致體驗(yàn)。世界正從數(shù)字化向智能化轉(zhuǎn)型,人工智能產(chǎn)業(yè)作為關(guān)鍵驅(qū)動(dòng)力,面臨自身的升級進(jìn)化的挑戰(zhàn)。華為在超強(qiáng)人工智能算力和大規(guī)模分布式AI訓(xùn)練集群兩個(gè)方面加速智能化世界的轉(zhuǎn)型。
Atlas 900 AI 訓(xùn)練集群介紹
在大型數(shù)據(jù)集上進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)架構(gòu)涵蓋從圖像識(shí)別、自然語言處理、視頻實(shí)時(shí)分析和智能推薦系統(tǒng)等各個(gè)方面,訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)模型需要大量浮點(diǎn)計(jì)算能力。近年來單個(gè)AI處理器算力和訓(xùn)練方法上均取得了重大進(jìn)步,但是在單一機(jī)器上,AI訓(xùn)練所需要的時(shí)間仍然長得不切實(shí)際,因此需要借助大規(guī)模分布式AI集群環(huán)境來提升神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)的浮點(diǎn)計(jì)算能力。
此次發(fā)布的Atlas 900 AI訓(xùn)練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,是當(dāng)前全球最快的AI訓(xùn)練集群,代表了當(dāng)今全球的算力巔峰。其總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺(tái)PC的計(jì)算能力。
Atlas 900 AI訓(xùn)練集群領(lǐng)先技術(shù)優(yōu)勢
AI算力業(yè)界領(lǐng)先
Atlas 900 AI訓(xùn)練集群采用業(yè)界單芯片算力最強(qiáng)的昇騰910AI處理器,每顆昇騰910AI處理器內(nèi)置32個(gè)達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓(xùn)練集群將數(shù)千顆昇騰910 AI處理器互聯(lián),打造業(yè)界第一的算力集群。
昇騰910AI處理器采用SoC設(shè)計(jì),集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數(shù)據(jù)預(yù)處理任務(wù),充分提升訓(xùn)練效率。
最佳集群網(wǎng)絡(luò)
Atlas 900 AI訓(xùn)練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時(shí)延,梯度同步時(shí)延縮短10~70%。
在AI服務(wù)器內(nèi)部,昇騰910 AI處理器之間通過HCCS高速總線互聯(lián);昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術(shù)互聯(lián),其速率是業(yè)界主流采用的PCIe 3.0(8.0Gb/s)技術(shù)的兩倍,使得數(shù)據(jù)傳輸更加快速和高效。在集群層面,采用面向數(shù)據(jù)中心的CloudEngine 8800系列交換機(jī),提供單端口100Gbps的交換速率,將集群內(nèi)的所有AI服務(wù)器接入高速交換網(wǎng)絡(luò)。
獨(dú)創(chuàng)iLossless 智能無損交換算法,對集群內(nèi)的網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)的學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)0丟包與E2E μs級時(shí)延。
系統(tǒng)級調(diào)優(yōu)
Atlas 900AI訓(xùn)練集群通過華為集合通信庫和作業(yè)調(diào)度平臺(tái),整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910AI處理器的強(qiáng)大性能。
華為集合通信庫提供訓(xùn)練網(wǎng)絡(luò)所需的分布式并行庫,通信庫+網(wǎng)絡(luò)拓?fù)?訓(xùn)練算法進(jìn)行系統(tǒng)級調(diào)優(yōu),實(shí)現(xiàn)集群線性度>80%,極大提升了作業(yè)調(diào)度效率。
極致散熱系統(tǒng)
傳統(tǒng)數(shù)據(jù)中心多以風(fēng)冷技術(shù)對設(shè)備進(jìn)行散熱,但在人工智能時(shí)代傳統(tǒng)數(shù)據(jù)中心卻面臨非常大的挑戰(zhàn)。高功耗器件比如CPU和AI芯片帶來更大的熱島效應(yīng)要求更高效的冷卻方式。液冷技術(shù)可以滿足數(shù)據(jù)中心高功率、高密部署、低PUE的超高需求。
Atlas 900 AI訓(xùn)練集群采用全液冷方案,創(chuàng)新性設(shè)計(jì)業(yè)界最強(qiáng)柜級密閉絕熱技術(shù),支撐>95%液冷占比。單機(jī)柜支持高達(dá)50kW超高散熱功耗,實(shí)現(xiàn)PUE<1.1的極致數(shù)據(jù)中心能源效率。
另外,在空間節(jié)省方面,與8kW風(fēng)冷機(jī)柜相比,節(jié)省機(jī)房空間79%。極致的液冷散熱技術(shù)滿足了高功率、高密設(shè)備部署、低PUE的需求,極大地降低了客戶的TCO。
Atlas 900AI訓(xùn)練集群領(lǐng)先的Benchmark指標(biāo)
華為已在華為云上部署了一個(gè)Atlas900AI訓(xùn)練集群,集群規(guī)模為1024顆昇騰910 AI處理器?;诋?dāng)前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k數(shù)據(jù)集”,Atlas 900AI訓(xùn)練集群只需59.8秒就可完成訓(xùn)練,排名全球第一。
“ ImageNet-1k數(shù)據(jù)集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas900 AI訓(xùn)練集群比第2名快15%。
Atlas 900AI 集群適用場景
Atlas 900 AI集群主要為大型數(shù)據(jù)集神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供超強(qiáng)算力,可廣泛應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,讓研究人員更快地進(jìn)行圖像、視頻和語音等AI模型訓(xùn)練,讓人類更高效地探索宇宙奧秘、預(yù)測天氣、勘探石油和加速自動(dòng)駕駛的商用進(jìn)程。
Atlas 900 AI集群也可以提供云服務(wù),以云的方式提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的AI平臺(tái),為客戶帶來極致體驗(yàn)的“易獲取、用得起、方便用”的普惠AI算力。
標(biāo)簽 華為- 責(zé)任編輯: 呂棟 
-
俄羅斯存放“天花病毒”的實(shí)驗(yàn)室發(fā)生爆炸
2019-09-18 10:36 -
云淡風(fēng)輕 華為發(fā)布最快AI訓(xùn)練集群Atlas 900
2019-09-18 10:20 華為 -
對美國制造業(yè)有功,蘋果獎(jiǎng)勵(lì)康寧2.5億美元
2019-09-18 09:41 美國經(jīng)濟(jì) -
HTC官宣新CEO 王雪紅仍擔(dān)任董事長
2019-09-18 08:56 商業(yè) -
華為-南京大學(xué)電聲創(chuàng)新實(shí)驗(yàn)室揭牌成立
2019-09-18 08:56 華為 -
國防科大打造史上最薄石墨烯燈泡,有望用于未來手機(jī)屏幕和芯片
2019-09-18 07:33 -
沙子快沒了?別擔(dān)心,造芯片主要用的不是它
2019-09-18 07:18 -
IDC:2019年Q2中國PC顯示器出貨量為722.9萬臺(tái)
2019-09-17 22:48 -
紫光國微:旗下紫光同芯THD89系列產(chǎn)品通過AEC-Q100車規(guī)認(rèn)證
2019-09-17 21:56 -
Wi-Fi聯(lián)盟于宣布正式推出Wi-Fi6認(rèn)證計(jì)劃
2019-09-17 20:03 -
中國遙感衛(wèi)星地面站成功接收資源一號(hào)02D衛(wèi)星數(shù)據(jù)
2019-09-17 17:52 -
上海聯(lián)通:裝備聯(lián)網(wǎng)是實(shí)現(xiàn)智能制造的基礎(chǔ)
2019-09-17 17:21 -
惠普打印機(jī)被發(fā)現(xiàn)偷偷回傳數(shù)據(jù):隱藏極深
2019-09-17 16:17 -
院士:光刻技術(shù)是國內(nèi)外集成電路領(lǐng)域差距最大的環(huán)節(jié)
2019-09-17 13:34 -
印度立志打造60臺(tái)超級計(jì)算機(jī):首批3臺(tái)已出爐
2019-09-17 13:11 -
中企承建蒙古國最大互通立交橋主橋通車,系該國最長橋梁
2019-09-17 12:41 -
華為WATCH GT2高清渲染圖曝光:三種表帶、超強(qiáng)防水/續(xù)航
2019-09-17 11:08 華為 -
中國科技團(tuán)隊(duì)解決地鐵隧道穿越敏感建構(gòu)筑物關(guān)鍵技術(shù)
2019-09-17 10:00 -
華為屏下前置攝像頭專利曝光:消滅劉海 打造真全面屏
2019-09-17 09:52 -
海南省長:海南推動(dòng)清潔能源島建設(shè),今后核電是主能源
2019-09-17 08:49
相關(guān)推薦 -
最新聞 Hot
-
“某些國家話說得很滿卻沒行動(dòng),中國正相反”
-
“我們幾乎轟炸了整個(gè)中東,卻一無所獲”
-
布林肯:美國的系統(tǒng)已經(jīng)崩潰
-
白宮把他這段發(fā)言記錄改了,共和黨人:涉嫌違法
-
“美國在糧食安全上的砝碼少了,中國安心了”
-
他無視北約:我們愛見誰就見誰
-
比美國更快?“這將成為中國的‘斯普特尼克時(shí)刻’”
-
哈里斯:特朗普一句話冒犯了女性,冒犯了所有人
-
詹姆斯:支持哈里斯
-
秘密赴美訓(xùn)練卻被美軍曝光,臺(tái)當(dāng)局“頗感頭痛”
-
“中國越抓緊,西方越焦慮”
-
“中國工業(yè)制造規(guī)模是美國三倍!不拉上盟友,怎么競爭?”
-
面對恐怖主義,美媒卻如此挑撥中國和“巴鐵”
-
德國外長訪華遭冷落?真相是…
-
美媒發(fā)現(xiàn)中國雙航母“亮點(diǎn)”:殲15B和殲15D已服役
-
以色列拿到情報(bào):伊朗要?jiǎng)邮至?,或在美國大選前
-