-
訊飛星火之后,螞蟻用國產(chǎn)芯片訓(xùn)練出2900億參數(shù)大模型
最后更新: 2025-03-24 18:53:073月24日,彭博社援引知情人士消息稱,螞蟻集團(tuán)已成功利用阿里巴巴、華為等國產(chǎn)芯片,結(jié)合混合專家(MoE)架構(gòu)訓(xùn)練出參數(shù)規(guī)模達(dá)2900億的大模型“Ling-Plus”,其性能與英偉達(dá)H800芯片訓(xùn)練的同類模型相當(dāng),且訓(xùn)練成本降低20%。這一突破是繼科大訊飛“星火大模型”之后,中國國產(chǎn)算力生態(tài)即將迎來的第二個標(biāo)志性大模型。
據(jù)螞蟻集團(tuán)Ling團(tuán)隊發(fā)布的論文,其自研的Ling系列模型通使用國產(chǎn)廠商(如壁仞科技、天數(shù)智芯、寒武紀(jì)等)的產(chǎn)品,訓(xùn)練1萬億Token的成本從635萬元降至508萬元,降幅達(dá)20%,但模型性能仍可對標(biāo)阿里通義Qwen2.5-72B和DeepSeek-V2.5。
針對外媒(彭博社)關(guān)于螞蟻百靈大模型訓(xùn)練成本的報道,螞蟻方面回應(yīng)觀察者網(wǎng)稱:螞蟻針對不同芯片持續(xù)調(diào)優(yōu),以降低AI應(yīng)用成本,目前取得了一定的進(jìn)展,也會逐步通過開源分享。
除了自研性能領(lǐng)先的大模型以外,該技術(shù)論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開發(fā)的效率與可及性。實驗表明,其3000億參數(shù)的MoE大模型可在使用國產(chǎn)GPU的低性能設(shè)備上完成高效訓(xùn)練,性能與完全使用英偉達(dá)芯片、同規(guī)模的稠密模型及MoE模型相當(dāng)。作為國內(nèi)較早布局AI大模型的廠商,螞蟻自研的百靈大模型2023年已通過備案,重點布局在生活服務(wù)、金融服務(wù)、醫(yī)療健康等場景的應(yīng)用。
在此之前,科大訊飛發(fā)布了首個基于全國產(chǎn)化算力平臺訓(xùn)練的全民開放大模型——訊飛星火V3.5。
本月,科大訊飛與華為聯(lián)合團(tuán)隊宣布,成功在昇騰國產(chǎn)算力集群上實現(xiàn)MoE模型的大規(guī)??绻?jié)點專家并行推理。這是繼深度求索(DeepSeek)公開MoE訓(xùn)練方案后,業(yè)界首個完全基于國產(chǎn)算力的解決方案。
通過算子融合、混合并行策略和通信計算并行優(yōu)化等一系列創(chuàng)新,科大訊飛在國產(chǎn)算力上實現(xiàn)了顯著性能提升:單卡靜態(tài)內(nèi)存占用縮減至雙機(jī)部署的1/4,效率提升75%,專家計算密度增加4倍,推理吞吐提升3.2倍,端到端時延降低50%。
基于此次科大訊飛攜手華為所做的首個基于國產(chǎn)算力的MoE模型訓(xùn)推方案,科大訊飛稱,這一突破性的解決方案也將應(yīng)用于訊飛星火深度推理模型的訓(xùn)練加速,預(yù)期訓(xùn)練時推理效率將提升200%。同時,基于該方案的推理引擎也實現(xiàn)了國產(chǎn)算力上DeepSeek-V3和R1的高效推理。
科大訊飛“星火”驗證了國產(chǎn)算力的可行性,螞蟻“Ling系列”則進(jìn)一步證明其規(guī)?;徒?jīng)濟(jì)性。隨著阿里、華為等巨頭加碼,中國AI產(chǎn)業(yè)正從“單點突破”轉(zhuǎn)向“生態(tài)協(xié)同”。這場算力平權(quán)運動,或?qū)⒊蔀槿駻I競賽的新變量。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 楊依婷 
-
京東外賣上線40天,日訂單首破百萬
2025-03-24 18:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
宣布斥資15億布局香港后,京東要把家電價格打到全港最低
2025-03-24 18:12 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
2元的一根妙可藍(lán)多奶酪,去年又掙了1.13億
2025-03-24 17:34 觀網(wǎng)財經(jīng)-消費 -
直擊F1中國大獎賽:空中云匯助力邁凱倫車隊實現(xiàn)“零時差支付”
2025-03-24 17:30 今日財經(jīng) -
途虎養(yǎng)車全網(wǎng)首發(fā)德國馬牌ExtremeContact XC7全新輪胎產(chǎn)品線
2025-03-24 17:26 -
控量挺價成效待考,舍得酒業(yè)2024年凈利驟降80%
2025-03-24 17:25 觀網(wǎng)財經(jīng)-消費 -
教培跑路頻發(fā),美團(tuán)這招行不行?
2025-03-24 17:24 觀網(wǎng)財經(jīng)-消費 -
2024年中國財政政策執(zhí)行情況報告發(fā)布
2025-03-24 16:23 -
TCL實業(yè)盧春水:掌握上游技術(shù),才是全球競爭的核心驅(qū)動力
2025-03-24 15:30 觀網(wǎng)財經(jīng)-科創(chuàng) -
五大芯片巨頭來華參會,高通三星高管到訪小米汽車工廠
2025-03-24 11:44 觀網(wǎng)財經(jīng)-科創(chuàng) -
中科院專家:RISC-V開辟中國芯片自主新賽道,還需攻克“三座大山”
2025-03-23 16:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
絲芙蘭迷失在中國,全球CEO緊急“救火”
2025-03-23 09:39 觀網(wǎng)財經(jīng)-消費 -
華為楊超斌:已有超80家伙伴基于昇騰打造大模型一體機(jī)
2025-03-22 21:40 觀網(wǎng)財經(jīng)-科創(chuàng) -
從鴻蒙手機(jī)到鴻蒙電腦,華為終端鴻蒙化提速
2025-03-22 08:40 觀網(wǎng)財經(jīng)-科創(chuàng) -
消息稱盒馬醞釀新店型,布局“1店+N倉”模式
2025-03-22 00:10 觀網(wǎng)財經(jīng)-消費 -
中美科技博弈下,233萬用戶選擇把票投給“WPS鴻蒙版”
2025-03-21 23:59 觀網(wǎng)財經(jīng)-科創(chuàng) -
嘉士伯控股重慶啤酒被指打壓民族品牌“山城”?真相沒那么簡單
2025-03-21 21:08 觀網(wǎng)財經(jīng)-消費 -
名創(chuàng)優(yōu)品2024年營收同比增長22.8%,全球門店凈增1219家
2025-03-21 21:07 觀網(wǎng)財經(jīng)-消費 -
蘋果AI被指控虛假宣傳
2025-03-21 20:59 觀網(wǎng)財經(jīng)-科創(chuàng) -
相關(guān)推薦 -
這也能扯上中國? 評論 145“特朗普政府出大糗,歐洲笑不出來” 評論 102“就算美國有再多,也不得不運往中國” 評論 109“或許我們不應(yīng)該問,‘為什么是杭州?’” 評論 106最新聞 Hot
-
特朗普擬對中國下“毒計”,美國農(nóng)民“被嚇傻了”
-
又打壓!美方揚言就是要“遏華”
-
這也能扯上中國?
-
“中國在這些方面都領(lǐng)先全球,如果全球南方能夠積極學(xué)習(xí)…”
-
美國對委內(nèi)瑞拉下手,實際沖中國來?
-
美方炒作涉臺問題:若有必要,中國試圖擊敗美國軍事干預(yù)
-
特朗普死不認(rèn)錯
-
澤連斯基:美國已被俄羅斯操縱
-
對華關(guān)系,盧卡申科最新表態(tài)
-
飛行員忘帶護(hù)照,美聯(lián)航一飛上海航班被迫返航
-
萬斯:我也要去格陵蘭
-
AI科學(xué)家放棄美國終身教職回國
-
奔馳高管:歐洲車企太依賴中美了
-
“特朗普政府出大糗,歐洲笑不出來”
-
“俄羅斯是敵是友?美情報高官集體面臨‘送命題’”
-
丹麥也怒了,“不可接受”
快訊- 蘋果AI支持中文了,iPhone也能用5.5G了
- 招行年報:經(jīng)營能力強(qiáng)韌 零售AUM近15萬億
- 200萬人次!印尼旅游業(yè)崛起指望中國游客
- “中國在這些方面都領(lǐng)先全球,如果全球南方能夠積極學(xué)習(xí)…”
- 庫克現(xiàn)身浙大,看到大學(xué)生創(chuàng)新項目直呼“unbelievable”
- 臺漢光演習(xí)以“2027年大陸攻臺”為假想?國臺辦回應(yīng)
- 韓方就中方黃海深海漁業(yè)養(yǎng)殖設(shè)施“表達(dá)關(guān)切”,我使館回應(yīng)
- “假健康證”事件發(fā)酵,絕味食品加盟模式遭拷問
-