-
中國團(tuán)隊(duì)連獲國際大獎,“有助于對抗美國芯片禁令”
【文/觀察者網(wǎng) 熊超然】上個(gè)月,全球計(jì)算機(jī)存儲領(lǐng)域的頂級學(xué)術(shù)會議——第23屆USENIX文件與存儲技術(shù)會議(USENIX Conference on File and Storage Technologies,簡稱FAST),在美國加利福尼亞州圣克拉拉舉行。
本屆大會上,來自中國的人工智能(AI)初創(chuàng)公司月之暗面(Moonshot AI)和清華大學(xué)團(tuán)隊(duì)合作發(fā)表論文并在其中提出一個(gè)名為Mooncake的系統(tǒng),因而獲得埃里克·里德爾最佳論文獎(Erik Riedel Best Paper Award)。
香港《南華早報(bào)》3月14日報(bào)道認(rèn)為,Mooncake這一款大語言模型系統(tǒng)的效率比之前的基準(zhǔn)提高了五倍,從而幫助降低了對計(jì)算資源的需求。在美國長期就中國獲取先進(jìn)AI芯片進(jìn)行圍堵打壓的背景下,這一成果還有助于對抗美國芯片禁令、減少對英偉達(dá)等企業(yè)出產(chǎn)的圖形處理單元(GPU)的依賴。
而在本月,無問芯穹(Infinigence AI)和上海交通大學(xué)、清華大學(xué)共同提出的視頻生成大模型推理IP工作——FlightVGM,也在國際頂級會議上獲獎。他們首次在可重構(gòu)邏輯集成電路(FPGA)上實(shí)現(xiàn)了視頻生成模型(VGMs)的高效推理,在美國半導(dǎo)體公司AMD廣泛可用的V80 FPGA芯片上,該系統(tǒng)在性能上提升了30%,能效比英偉達(dá)旗艦產(chǎn)品RTX 3090 GPU高出4.5倍。
《南華早報(bào)》稱,中國AI科研團(tuán)隊(duì)用工業(yè)芯片取代英偉達(dá)高端GPU而獲全球大獎,這預(yù)示著全球優(yōu)化AI硬件的競賽也出現(xiàn)了重大轉(zhuǎn)變。
埃里克·里德爾最佳論文獎 清華大學(xué)網(wǎng)站新聞圖
據(jù)報(bào)道,這篇獲獎?wù)撐挠汕迦A大學(xué)計(jì)算機(jī)系教師章明星、武永衛(wèi)、鄭緯民團(tuán)隊(duì)和月之暗面公司合作發(fā)表,名為“以鍵值緩存為中心的以存換算大語言模型推理架構(gòu)”(Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot)。論文的第一作者為計(jì)算機(jī)系博士生秦若愚,導(dǎo)師為助理教授章明星。
根據(jù)清華大學(xué)方面的介紹,該論文提出的系統(tǒng)Mooncake,是月之暗面推出的大語言模型服務(wù)Kimi的底層推理服務(wù)平臺。Mooncake采用了一種以鍵值緩存(KVCache)為中心的分離架構(gòu),不僅將預(yù)填充和解碼集群分離,還高效利用了推理集群中未充分利用的CPU、DRAM、SSD和NIC資源,構(gòu)建了一個(gè)獨(dú)立的KVCache緩存池。其核心創(chuàng)新在于以KVCache為中心的全局緩存和調(diào)度器,旨在嚴(yán)格延遲相關(guān)服務(wù)級別目標(biāo)(SLOs)下最大化吞吐量。
實(shí)驗(yàn)結(jié)果顯示,Mooncake在處理長上下文輸入的場景中表現(xiàn)出色。在使用真實(shí)數(shù)據(jù)進(jìn)行的測試中,與基線方法相比,Mooncake在符合SLOs的情況下,將有效請求處理能力提升了59%至498%。目前,Mooncake已在數(shù)千個(gè)節(jié)點(diǎn)上運(yùn)行,每日處理超過1000億個(gè)token。在實(shí)際部署中,Mooncake的創(chuàng)新架構(gòu)使Kimi在NVIDIA A800和H800集群上分別比以前的系統(tǒng)多處理115%和107%的請求。
《南華早報(bào)》指出,一段時(shí)間以來,美國政府已對向中國出口先進(jìn)AI芯片實(shí)施了一系列限制措施,包括對英偉達(dá)高端芯片的多項(xiàng)禁令。
英偉達(dá)的AI芯片在全球范圍內(nèi)廣泛部署。 《華爾街日報(bào)》
早在2022年10月,美國政府就已實(shí)施了一系列AI芯片出口限制措施,英偉達(dá)由于無法向中國市場提供A100和H100這兩款A(yù)I處理器,專門為中國市場特供符合美方規(guī)定的A800和H800芯片,以繞開美國政府的管制。
2023年10月,美國商務(wù)部又發(fā)布了一系列新的芯片出口限制,擴(kuò)大了對高級AI芯片的定義,并對運(yùn)往40多個(gè)國家的芯片產(chǎn)品提出額外的許可要求,以避免轉(zhuǎn)售給中國。這一新的限制措施出臺,意味著A800和H800芯片也被列入禁售名單。
美方想方設(shè)法圍堵打壓,就是意圖限制中國在AI領(lǐng)域的計(jì)算能力,進(jìn)而壓制AI模型的訓(xùn)練和開發(fā)。然而,這些限制反而促使中方研究人員和企業(yè)尋求通過軟件優(yōu)化和創(chuàng)新數(shù)據(jù)結(jié)構(gòu)來挖掘現(xiàn)有芯片潛力的方法。
據(jù)報(bào)道,清華大學(xué)MADSys實(shí)驗(yàn)室已在軟件源代碼托管服務(wù)平臺GitHub上啟動了Mooncake項(xiàng)目,旨在加速該技術(shù)的采用和傳播。與此同時(shí),該項(xiàng)目已被包括阿里巴巴和螞蟻集團(tuán)在內(nèi)的多家公司內(nèi)部采用,并已融入開源社區(qū)。
- 責(zé)任編輯: 熊超然 
-
“不及中國1/200!”美國卷不動,日韓很興奮
2025-03-14 22:28 觀察者頭條 -
重大戰(zhàn)果:2255人被押解回國
2025-03-14 22:24 打擊網(wǎng)絡(luò)詐騙 -
特朗普:我跟普京聊過了,要他饒烏軍一命
2025-03-14 22:09 應(yīng)對特朗普沖擊波 -
“美國拒絕了:還得改”
2025-03-14 21:41 烏克蘭之殤 -
升級!俄奪回三座城鎮(zhèn),烏稱擊退22次進(jìn)攻
2025-03-14 21:12 烏克蘭之殤 -
“中方應(yīng)該會歡迎?”
2025-03-14 21:05 中美關(guān)系 -
關(guān)稅狂飆美股跳水,“特朗普衰退”真要來了?
2025-03-14 18:37 特朗普 -
“同意但有條件”,普京聲明全文:感謝中印巴西南非
2025-03-14 18:05 烏克蘭之殤 -
普京提議與特朗普會談,中方表態(tài)
2025-03-14 16:19 烏克蘭之殤 -
就伊朗核問題,王毅提出五點(diǎn)主張
2025-03-14 16:04 伊朗局勢 -
美國肉商出口資質(zhì)快到期了:很急,但中國沒回
2025-03-14 16:03 應(yīng)對特朗普沖擊波 -
赤裸裸的權(quán)錢交易?特朗普家族被曝和幣安談入股
2025-03-14 15:47 -
特朗普:有計(jì)劃與金正恩重建關(guān)系
2025-03-14 15:17 -
不裝了!OpenAI上書特朗普:要對中國AI下死手
2025-03-14 14:20 人工智能 -
美國諾獎得主急了:攪吧攪吧!最后連高端制藥都得從中國買了
2025-03-14 14:12 應(yīng)對特朗普沖擊波 -
中俄伊聯(lián)合聲明
2025-03-14 14:03 中國外交 -
伊朗核問題中俄伊北京會晤:三方強(qiáng)調(diào)終止所有非法單邊制裁的必要性
2025-03-14 13:53 -
北京會晤舉行,中俄伊交換意見
2025-03-14 11:57 中國外交 -
日本男女在長城上做不雅行為,被驅(qū)逐出境!
2025-03-14 11:44 中日關(guān)系 -
歐盟外長又來:美歐互咬,中國在笑
2025-03-14 11:43 觀察者頭條
相關(guān)推薦 -
義烏有信心挺過去,心疼美國一秒:他們上哪兒找襪子? 評論 196最新聞 Hot
-
歐盟抱怨:談了兩小時(shí),不知道美國要什么
-
隔空互懟,萬斯批澤連斯基:荒謬
-
“眼下是美國痛感更強(qiáng)、壓力更大,想重回談判桌”
-
“他倆激烈爭吵,姆努欽還被拉出來鞭尸”
-
哈梅內(nèi)伊表態(tài)
-
尷尬!萬斯舉起獎杯,底兒掉了......網(wǎng)友:美國制造?
-
“華裔科學(xué)家五年前在美墜亡,與美方調(diào)查有關(guān)?”
-
“特朗普,白日做夢”
-
英國人也火大:中國對特朗普的評價(jià),很難不贊同
-
義烏有信心挺過去,心疼美國一秒:他們上哪兒找襪子?
-
美財(cái)長污蔑中國“奪走”拉美礦權(quán),中方駁斥
-
果然,又威脅歐洲:中國還是美國?
-
搖擺州共和黨人急死:中國都說奉陪到底了…
-
“美對華牛肉出口停滯,澳大利亞火速補(bǔ)位”
-
“美國客戶急電:SOS!90天內(nèi),能發(fā)多少發(fā)多少”
-
AI生成“吉卜力風(fēng)格”圖片席卷網(wǎng)絡(luò),爭議來了
-