-
中國團(tuán)隊連獲國際大獎,“有助于對抗美國芯片禁令”
【文/觀察者網(wǎng) 熊超然】上個月,全球計算機(jī)存儲領(lǐng)域的頂級學(xué)術(shù)會議——第23屆USENIX文件與存儲技術(shù)會議(USENIX Conference on File and Storage Technologies,簡稱FAST),在美國加利福尼亞州圣克拉拉舉行。
本屆大會上,來自中國的人工智能(AI)初創(chuàng)公司月之暗面(Moonshot AI)和清華大學(xué)團(tuán)隊合作發(fā)表論文并在其中提出一個名為Mooncake的系統(tǒng),因而獲得埃里克·里德爾最佳論文獎(Erik Riedel Best Paper Award)。
香港《南華早報》3月14日報道認(rèn)為,Mooncake這一款大語言模型系統(tǒng)的效率比之前的基準(zhǔn)提高了五倍,從而幫助降低了對計算資源的需求。在美國長期就中國獲取先進(jìn)AI芯片進(jìn)行圍堵打壓的背景下,這一成果還有助于對抗美國芯片禁令、減少對英偉達(dá)等企業(yè)出產(chǎn)的圖形處理單元(GPU)的依賴。
而在本月,無問芯穹(Infinigence AI)和上海交通大學(xué)、清華大學(xué)共同提出的視頻生成大模型推理IP工作——FlightVGM,也在國際頂級會議上獲獎。他們首次在可重構(gòu)邏輯集成電路(FPGA)上實現(xiàn)了視頻生成模型(VGMs)的高效推理,在美國半導(dǎo)體公司AMD廣泛可用的V80 FPGA芯片上,該系統(tǒng)在性能上提升了30%,能效比英偉達(dá)旗艦產(chǎn)品RTX 3090 GPU高出4.5倍。
《南華早報》稱,中國AI科研團(tuán)隊用工業(yè)芯片取代英偉達(dá)高端GPU而獲全球大獎,這預(yù)示著全球優(yōu)化AI硬件的競賽也出現(xiàn)了重大轉(zhuǎn)變。
埃里克·里德爾最佳論文獎 清華大學(xué)網(wǎng)站新聞圖
據(jù)報道,這篇獲獎?wù)撐挠汕迦A大學(xué)計算機(jī)系教師章明星、武永衛(wèi)、鄭緯民團(tuán)隊和月之暗面公司合作發(fā)表,名為“以鍵值緩存為中心的以存換算大語言模型推理架構(gòu)”(Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot)。論文的第一作者為計算機(jī)系博士生秦若愚,導(dǎo)師為助理教授章明星。
根據(jù)清華大學(xué)方面的介紹,該論文提出的系統(tǒng)Mooncake,是月之暗面推出的大語言模型服務(wù)Kimi的底層推理服務(wù)平臺。Mooncake采用了一種以鍵值緩存(KVCache)為中心的分離架構(gòu),不僅將預(yù)填充和解碼集群分離,還高效利用了推理集群中未充分利用的CPU、DRAM、SSD和NIC資源,構(gòu)建了一個獨立的KVCache緩存池。其核心創(chuàng)新在于以KVCache為中心的全局緩存和調(diào)度器,旨在嚴(yán)格延遲相關(guān)服務(wù)級別目標(biāo)(SLOs)下最大化吞吐量。
實驗結(jié)果顯示,Mooncake在處理長上下文輸入的場景中表現(xiàn)出色。在使用真實數(shù)據(jù)進(jìn)行的測試中,與基線方法相比,Mooncake在符合SLOs的情況下,將有效請求處理能力提升了59%至498%。目前,Mooncake已在數(shù)千個節(jié)點上運(yùn)行,每日處理超過1000億個token。在實際部署中,Mooncake的創(chuàng)新架構(gòu)使Kimi在NVIDIA A800和H800集群上分別比以前的系統(tǒng)多處理115%和107%的請求。
《南華早報》指出,一段時間以來,美國政府已對向中國出口先進(jìn)AI芯片實施了一系列限制措施,包括對英偉達(dá)高端芯片的多項禁令。
英偉達(dá)的AI芯片在全球范圍內(nèi)廣泛部署。 《華爾街日報》
早在2022年10月,美國政府就已實施了一系列AI芯片出口限制措施,英偉達(dá)由于無法向中國市場提供A100和H100這兩款A(yù)I處理器,專門為中國市場特供符合美方規(guī)定的A800和H800芯片,以繞開美國政府的管制。
2023年10月,美國商務(wù)部又發(fā)布了一系列新的芯片出口限制,擴(kuò)大了對高級AI芯片的定義,并對運(yùn)往40多個國家的芯片產(chǎn)品提出額外的許可要求,以避免轉(zhuǎn)售給中國。這一新的限制措施出臺,意味著A800和H800芯片也被列入禁售名單。
美方想方設(shè)法圍堵打壓,就是意圖限制中國在AI領(lǐng)域的計算能力,進(jìn)而壓制AI模型的訓(xùn)練和開發(fā)。然而,這些限制反而促使中方研究人員和企業(yè)尋求通過軟件優(yōu)化和創(chuàng)新數(shù)據(jù)結(jié)構(gòu)來挖掘現(xiàn)有芯片潛力的方法。
據(jù)報道,清華大學(xué)MADSys實驗室已在軟件源代碼托管服務(wù)平臺GitHub上啟動了Mooncake項目,旨在加速該技術(shù)的采用和傳播。與此同時,該項目已被包括阿里巴巴和螞蟻集團(tuán)在內(nèi)的多家公司內(nèi)部采用,并已融入開源社區(qū)。
- 責(zé)任編輯: 熊超然 
-
“不及中國1/200!”美國卷不動,日韓很興奮
2025-03-14 22:28 觀察者頭條 -
重大戰(zhàn)果:2255人被押解回國
2025-03-14 22:24 打擊網(wǎng)絡(luò)詐騙 -
特朗普:我跟普京聊過了,要他饒烏軍一命
2025-03-14 22:09 應(yīng)對特朗普沖擊波 -
“美國拒絕了:還得改”
2025-03-14 21:41 烏克蘭之殤 -
升級!俄奪回三座城鎮(zhèn),烏稱擊退22次進(jìn)攻
2025-03-14 21:12 烏克蘭之殤 -
“中方應(yīng)該會歡迎?”
2025-03-14 21:05 中美關(guān)系 -
關(guān)稅狂飆美股跳水,“特朗普衰退”真要來了?
2025-03-14 18:37 特朗普 -
“同意但有條件”,普京聲明全文:感謝中印巴西南非
2025-03-14 18:05 烏克蘭之殤 -
普京提議與特朗普會談,中方表態(tài)
2025-03-14 16:19 烏克蘭之殤 -
就伊朗核問題,王毅提出五點主張
2025-03-14 16:04 伊朗局勢 -
美國肉商出口資質(zhì)快到期了:很急,但中國沒回
2025-03-14 16:03 應(yīng)對特朗普沖擊波 -
赤裸裸的權(quán)錢交易?特朗普家族被曝和幣安談入股
2025-03-14 15:47 -
特朗普:有計劃與金正恩重建關(guān)系
2025-03-14 15:17 -
不裝了!OpenAI上書特朗普:要對中國AI下死手
2025-03-14 14:20 人工智能 -
美國諾獎得主急了:攪吧攪吧!最后連高端制藥都得從中國買了
2025-03-14 14:12 應(yīng)對特朗普沖擊波 -
中俄伊聯(lián)合聲明
2025-03-14 14:03 中國外交 -
伊朗核問題中俄伊北京會晤:三方強(qiáng)調(diào)終止所有非法單邊制裁的必要性
2025-03-14 13:53 -
北京會晤舉行,中俄伊交換意見
2025-03-14 11:57 中國外交 -
日本男女在長城上做不雅行為,被驅(qū)逐出境!
2025-03-14 11:44 中日關(guān)系 -
歐盟外長又來:美歐互咬,中國在笑
2025-03-14 11:43 觀察者頭條
相關(guān)推薦 -
“不及中國1/200!”美國卷不動,日韓很興奮 評論 26關(guān)稅狂飆美股跳水,“特朗普衰退”真要來了? 評論 106美國肉商出口資質(zhì)快到期了:很急,但中國沒回 評論 142歐盟外長又來:美歐互咬,中國在笑 評論 359普京同意?;?,澤連斯基:別信,美歐趕緊制裁 評論 237最新聞 Hot
-
“不及中國1/200!”美國卷不動,日韓很興奮
-
中國團(tuán)隊連獲國際大獎,“有助于對抗美國禁令”
-
白宮下了指示:不排除入侵,但…
-
特朗普:我跟普京聊過了,要他饒烏軍一命
-
“美國拒絕了:還得改”
-
“中方應(yīng)該會歡迎?”
-
升級!俄奪回三座城鎮(zhèn),烏稱擊退22次進(jìn)攻
-
關(guān)稅狂飆美股跳水,“特朗普衰退”真要來了?
-
“同意但有條件”,普京聲明全文:感謝中印巴西南非
-
“鳥兒全飛回來了,中國在這一領(lǐng)域全球領(lǐng)先”
-
美國肉商出口資質(zhì)快到期了:很急,但中國沒回
-
歐盟外長又來:美歐互咬,中國在笑
-
赤裸裸的權(quán)錢交易?特朗普家族被曝和幣安談入股
-
美國諾獎得主急了:攪吧攪吧!最后連高端制藥都得從中國買了
-
不裝了!OpenAI上書特朗普:要對中國AI下死手
-
日本男女在長城上做不雅行為,被驅(qū)逐出境!
-