-
阿里云發(fā)布QwQ-32B:僅用1/20參數(shù)比肩滿血DS-R1,可在消費(fèi)級顯卡部署
-
連政guanchazhewanxgun
最后更新: 2025-03-06 11:42:483月6日凌晨,阿里云發(fā)布并開源全新的推理模型通義千問QwQ-32B。官方稱,這個(gè)新模型僅僅擁有320億參數(shù),但在性能上比肩6710億參數(shù)的滿血版DeepSeek R1。
目前,阿里云并未發(fā)布還完整技術(shù)報(bào)告,但官方數(shù)據(jù)顯示,QwQ-32B僅在編程競賽(LiveCodeBench)和美國數(shù)學(xué)競賽(AIME24)兩項(xiàng)略遜于滿血的DeepSeek-R1,其余三項(xiàng)則全面超越。此外更是碾壓完全超越了OpenAI-o1-mini。
阿里云解釋稱,團(tuán)隊(duì)此次基于Qwen2.5-32B模型,探索了擴(kuò)展強(qiáng)化學(xué)習(xí)(RL)的技術(shù)方案,并發(fā)現(xiàn)強(qiáng)化學(xué)習(xí)訓(xùn)練能夠持續(xù)提升模型性能,尤其在數(shù)學(xué)與編程任務(wù)中表現(xiàn)顯著。該團(tuán)隊(duì)還提到,通過持續(xù)擴(kuò)展強(qiáng)化學(xué)習(xí)訓(xùn)練的規(guī)模,中型模型也可以實(shí)現(xiàn)與巨型混合專家模型(MoE)相媲美的性能。
此外,QwQ-32B還滿足更低的資源消耗需求,適合快速響應(yīng)或?qū)?shù)據(jù)安全要求高的應(yīng)用場景,開發(fā)者和企業(yè)可以在消費(fèi)級顯卡上將其部署到本地設(shè)備中,進(jìn)一步打造高度定制化的AI解決方案。阿里稱,QwQ-32B已多個(gè)平臺基于寬松的Apache2.0協(xié)議開源,所有人都可免費(fèi)下載模型進(jìn)行本地部署,或者通過阿里云百煉平臺直接調(diào)用模型API服務(wù)。
值得一提的是,此前OpenAI曾因遇到技術(shù)瓶頸,將原來的GPT5.0降格為GPT4.5進(jìn)行發(fā)布,之后還透露將降低強(qiáng)化學(xué)習(xí)訓(xùn)練的優(yōu)先級,轉(zhuǎn)向監(jiān)督學(xué)習(xí)(SSL)和語言模型(LM)為核心的技術(shù)路線。而QwQ-32B的發(fā)布則證明了強(qiáng)化學(xué)習(xí)路線仍有潛力,可以繼續(xù)提升模型的性能。
千問QwQ-32B模型中還集成了與智能體Agent相關(guān)的能力,使其能夠在使用工具的同時(shí)進(jìn)行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。通義團(tuán)隊(duì)表示,未來將繼續(xù)探索將智能體與強(qiáng)化學(xué)習(xí)的集成,以實(shí)現(xiàn)長時(shí)推理,探索更高智能進(jìn)而最終實(shí)現(xiàn)AGI的目標(biāo)。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
|舉報(bào)-
違反法律法規(guī) -
垃圾信息、廣告 -
色情、淫穢信息 -
人身攻擊 -
謠言、不實(shí)信息 -
冒充,冒用信息 -
破壞社區(qū)秩序 -
其他 -
涉未成年人有害信息
- 責(zé)任編輯: 連政 
-
算力版圖的國運(yùn)賭局
2025-03-06 10:28 -
今年政府債務(wù)增加2.9萬億,都用在哪?
2025-03-05 21:26 2025兩會 -
烘培、燒烤、麻辣燙……海底撈“副牌”狂奔
2025-03-05 19:01 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
微軟推出免費(fèi)廣告版Office?網(wǎng)友:怕是欺負(fù)外國用戶沒用過WPS
2025-03-05 17:46 觀網(wǎng)財(cái)經(jīng)-海外 -
大模型工具Ollama存在安全隱患,本地部署Deepseek需小心
2025-03-05 17:30 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
追趕騰訊!字節(jié)跳動最新估值3150億美元
2025-03-05 17:25 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
全國人大代表趙紅果:加快制定完善的新茶飲行業(yè)標(biāo)準(zhǔn)
2025-03-05 17:24 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
張頤武、戶思社委員:建議加大對侵犯著作權(quán)犯罪懲治力度
2025-03-05 17:23 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
年薪250萬的CFO離職,舍得酒業(yè)人事頻繁動蕩
2025-03-05 17:16 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
使用騰訊元寶將被迫授予文章使用權(quán)?官方回應(yīng)
2025-03-05 17:05 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
李云澤表態(tài)拉長穩(wěn)樓市白名單,專家:有助增強(qiáng)民企投資信心
2025-03-05 16:19 2025兩會 -
-
國家市場監(jiān)督總局:今年將出臺直播電商監(jiān)管辦法
2025-03-05 14:10 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
巴展觀察:華為傳音展示三折疊,聯(lián)想太陽能PC亮相
2025-03-05 13:26 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
支線物流起飛!順豐訂購百架翊飛航空大型無人運(yùn)輸機(jī)
2025-03-05 13:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
國產(chǎn)視頻模型企業(yè)愛詩科技再獲億級融資,曾靠“毒液”視頻出圈
2025-03-05 12:56
相關(guān)推薦 -
-
最新聞 Hot
-
歐洲多國驚覺:被美國掌握一個(gè)“致命開關(guān)”
-
對歐洲“感到憤怒”,“特朗普想把駐德美軍全撤走”
-
紐約發(fā)生多起山火,紐約州進(jìn)入緊急狀態(tài)
-
特朗普威脅“不談就打”,伊朗最高領(lǐng)袖表態(tài)
-
“烏克蘭半瞎了,歐洲急了”
-
尹錫悅獲釋第二天,首爾10萬民眾集會游行
-
美媒哀嘆:所謂的“西方”,已蕩然無存
-
“1500億歐元貸款計(jì)劃,法德又吵起來了”
-
“看看中國高鐵再看美鐵,尬死了”
-
特朗普怒砍哥大4億美元:打擊“反猶”不給力啊
-
“特朗普想重新劃定美加邊界”
-
“魯比奧與馬斯克干架了”,特朗普忙滅火
-
“因?yàn)槲沂敲绹?,在臺積電被罵又懶又蠢”,下月開庭
-
“普京愿意,但有條件”
-
“最大受害者是波音,中國要么用國產(chǎn),要么買空客”
-
特朗普:和烏克蘭打交道比和俄羅斯更難
-