-
DeepSeek-R1模型震驚硅谷,美媒:制裁反而促進中國創(chuàng)新
最后更新: 2025-01-27 15:17:04【文/觀察者網(wǎng) 陳思佳】這兩天,中國人工智能公司深度求索(DeepSeek)發(fā)布的大模型DeepSeek-R1震動業(yè)界,該模型使用更低的成本和更小的算力規(guī)模,實現(xiàn)了足以匹敵美國頂尖AI模型的效果。這一成果引發(fā)全球科技行業(yè)高度關注,西方媒體也發(fā)文感嘆“中國AI模型震驚硅谷”。
最新消息顯示,DeepSeek已經(jīng)登頂了中國和美國的蘋果App Store應用商店,排名第一,將ChatGPT一舉超越。對于一款中國大模型來說,能夠在美國力壓ChatGPT,是絕無僅有的歷史性一刻。
據(jù)美國《華爾街日報》當?shù)貢r間1月26日報道,DeepSeek-R1的出色表現(xiàn)已經(jīng)給美國科技行業(yè)留下深刻印象,從業(yè)者紛紛稱贊深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美國試圖通過制裁限制中國的AI發(fā)展,但資源的限制反而激發(fā)了中國科研人員的創(chuàng)造力。
深度求索在1月20日發(fā)布了DeepSeek-R1模型,該公司表示,DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,其性能比肩美國OpenAI o1正式版。
為促進技術社區(qū)的充分交流與創(chuàng)新協(xié)作,深度求索還公開了DeepSeek-R1訓練技術。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比較 DeepSeek微信公眾號
一些第三方測試結果也顯示,DeepSeek-R1的表現(xiàn)足以匹敵美國頂尖AI模型。美國加州大學伯克利分校研究人員設立的聊天機器人競技場(Chatbot Arena)平臺上,DeepSeek-R1和去年12月發(fā)布的DeepSeek-V3的性能表現(xiàn)均位列前十。
不僅如此,DeepSeek的開發(fā)成本和使用的算力規(guī)模都遠低于美國頂尖AI公司。先前發(fā)布的DeepSeek-V3在僅使用2048顆英偉達H800 GPU的情況下,完成了6710億參數(shù)模型的訓練,成本約為560萬美元,這遠低于其他頂級模型的訓練成本。美媒指出,H800的算力要弱于英偉達H100等芯片,美國限制對華出口此類高性能芯片。
《華爾街日報》提到,作為對比,美國AI企業(yè)、Claude模型開發(fā)商Anthropic首席執(zhí)行官達里奧·阿莫代伊(Dario Amodei)去年曾透露,該公司構建模型的成本約為1億至10億美元。
與其他一些頂尖大模型不同,DeepSeek-R1沒有使用傳統(tǒng)的監(jiān)督微調(diào)(SFT)方法,而是專注于強化學習(RL),這意味著該模型跳過了使用人工標準數(shù)據(jù)訓練的“模仿”環(huán)節(jié)。
英偉達高級研究科學家范麟熙(Jim Fan)稱贊DeepSeek取得了突破,他在社交平臺X上發(fā)文稱,DeepSeek-R1完全由強化學習驅動,“這讓人想起了AlphaZero,從零開始學習圍棋、將棋和國際象棋,而不是先模仿人類大師的動作。這是論文中最重要的收獲?!?
DeepSeek-R1的表現(xiàn)引起美國科技行業(yè)的高度關注。硅谷風險投資家馬克·安德森(Marc Andreessen)表示:“DeepSeek-R1是我見過的最令人驚嘆,最令人印象深刻的突破之一。”
舊金山AI硬件公司Positron的聯(lián)合創(chuàng)始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在討論DeepSeek的開源模型,“這太酷了?!?
一些美國企業(yè)也開始在工作中使用DeepSeek。硅谷一家創(chuàng)業(yè)公司的聯(lián)合創(chuàng)始人安東尼·普奧(Anthony Poo)告訴《華爾街日報》,他們原先使用Claude模型預測財務回報,但現(xiàn)在已轉向DeepSeek,兩者性能相似,使用DeepSeek的成本僅為Claude的四分之一。
普奧說:“OpenAI的模型有著極佳的性能,但我們不想為我們不需要的能力付費?!?
截至北京時間今早,DeepSeek在美區(qū)蘋果App Store免費榜上已經(jīng)排在第一位,力壓此前霸榜的ChatGPT。而就在昨天早上,DeepSeek還沒有擠進榜單前五,顯示出過去24小時發(fā)酵速度之快。在國區(qū)蘋果App Store免費榜,DeepSeek也已登頂。
DeepSeek已在蘋果App Store國區(qū)和美區(qū)免費榜登頂
近年來,美國在芯片等領域對中國實施出口限制,試圖打壓中國在AI等領域的發(fā)展,但深度求索依然能構建出匹敵美國頂尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美國的限制未能阻止DeepSeek的進步,“這凸顯了一個深刻的教訓:資源限制反而能激發(fā)創(chuàng)造力?!?
數(shù)字新聞雜志The Wire China發(fā)文稱,DeepSeek-R1的發(fā)布將迫使懷疑論者重新評估中國的技術發(fā)展。深度求索對開源承諾的堅持也與OpenAI的專有策略形成鮮明對比,深度求索允許全球企業(yè)和開發(fā)者共同開發(fā)和改進技術,OpenAI則限制對其系統(tǒng)的訪問以維護競爭優(yōu)勢。
該雜志指出,美國決策者應該反思,通過設置障礙來確保領先地位的方法是否還行得通。美國的出口管制促使中國加速實現(xiàn)技術的自給自足,中美在芯片等領域的技術差距正逐漸縮小,美國的制裁雖然具有破壞性,卻可能反過來助推中國的創(chuàng)新能力。
文章寫道,美國的出口管制不僅削弱了美國科技公司的收入,也導致全球半導體供應鏈變得愈發(fā)“支離破碎”,“美國越是專注于遏制對手而不解決自身的缺陷,就越有可能加速其領先地位的喪失?!?
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉載。
標簽 人工智能- 責任編輯: 陳思佳 
-
加拿大媒體炮轟:我們都快被特朗普蛐蛐死了,你人呢?
2025-01-27 14:51 應對特朗普沖擊波 -
-
“我永遠不會反華,美國收買不了我”
2025-01-27 14:11 中國外交 -
“伊朗還盯著呢!怎么能把他們安保撤了?”
2025-01-27 12:17 應對特朗普沖擊波 -
他又挑撥!越南總理表態(tài)
2025-01-27 11:49 南海局勢 -
濟州航空空難初步調(diào)查報告公布:撞機4分鐘前黑匣子停止記錄
2025-01-27 11:46 三八線之南 -
丹麥被貼臉開大:笑死,多搞幾條狗,你也好意思…
2025-01-27 11:08 應對特朗普沖擊波 -
“美中如果有更多的雙贏元素,那就太好了”
2025-01-27 10:50 中美關系 -
芝加哥、亞特蘭大、洛杉磯……美國開始非法移民大抓捕
2025-01-27 10:31 美國政治 -
軍機遣返移民被拒后,特朗普加稅25%!哥倫比亞硬剛
2025-01-27 10:11 應對特朗普沖擊波 -
中薩(摩亞)政府簽署互免簽證協(xié)定
2025-01-27 10:01 -
巴勒斯坦、約旦、埃及全都反對!哈馬斯回懟
2025-01-27 08:43 巴以恩仇錄 -
白宮:黎以?;饏f(xié)議延長至2月18日
2025-01-27 08:20 -
官宣!盧卡申科勝選
2025-01-27 08:00 -
馬斯克提議:將“英吉利海峽”更名為“喬治·華盛頓海峽”
2025-01-27 07:43 應對特朗普沖擊波 -
美新任防長與以總理通話:美國將與以色列站在一起
2025-01-27 07:33 巴以恩仇錄 -
伊朗“加沙”重型無人機首次亮相
2025-01-27 07:05 伊朗局勢 -
拉脫維亞與瑞典的一條水下光纜遭到損壞
2025-01-27 07:05 歐洲亂局 -
盧卡申科將贏得白俄大選:出口民調(diào)87.6%
2025-01-27 07:05 -
李強同外國專家舉行新春座談會
2025-01-27 07:05
相關推薦 -
顛覆國本?特朗普“擅闖”司法部 評論 108“商飛進軍越南,更進一步” 評論 59警惕!G7聲明竟未提“一個中國” 評論 542“不及中國1/200!”美國卷不動,日韓很興奮 評論 141關稅狂飆美股跳水,“特朗普衰退”真要來了? 評論 136最新聞 Hot