-
對(duì)話|應(yīng)對(duì)卡脖子,開源是中國(guó)大模型安全的最優(yōu)解?
-
張廣凱13764468101
最后更新: 2025-01-23 16:49:09文/觀察者網(wǎng) 張廣凱
2025開年伊始,國(guó)內(nèi)大模型行業(yè)似乎正醞釀著一場(chǎng)劇烈的格局變動(dòng)。
一邊是零一萬(wàn)物與阿里云達(dá)成合作,不再獨(dú)立追求超大模型的預(yù)訓(xùn)練;另一邊,以豆包為代表的大廠模型仍在快速進(jìn)化,“不差錢”的DeepSeek更是以創(chuàng)新架構(gòu),讓人看到超越OpenAI的可能性。
這似乎印證了一段時(shí)間以來(lái)的流言:國(guó)內(nèi)大模型企業(yè)將進(jìn)一步收斂,一些過(guò)去的頭部玩家也開始掉隊(duì)?
另一個(gè)有趣的現(xiàn)象是,此前一直走閉源路線的MiniMax,最近突然發(fā)布了自己的開源模型。開源是弱勢(shì)方爭(zhēng)奪市場(chǎng)的捷徑,還是本身就具備比閉源更好的商業(yè)邏輯閉環(huán)?
當(dāng)然,美國(guó)對(duì)中國(guó)愈加嚴(yán)厲的政策限制,一直都是不容忽視的巨大風(fēng)險(xiǎn)。國(guó)產(chǎn)大模型行業(yè)準(zhǔn)備好迎接進(jìn)一步脫鉤了嗎?
圍繞上述話題,我們邀請(qǐng)AI生態(tài)專家、曾任零一萬(wàn)物開源及開發(fā)者生態(tài)負(fù)責(zé)人的林旅強(qiáng),以及Hugging Face工程師王鐵震進(jìn)行對(duì)話,收獲了不少新穎的觀點(diǎn)。
林旅強(qiáng)
王鐵震
摘要如下:
·中國(guó)大模型行業(yè)的研發(fā)能力與OpenAI沒有明顯差距,即使放棄預(yù)訓(xùn)練的團(tuán)隊(duì),也并非因?yàn)橛?xùn)練效果不佳,只是更好的商業(yè)選擇。
·隨著主流模型能力基本夠用,一味追求模型能力最強(qiáng)或許是個(gè)誤區(qū)。以操作系統(tǒng)為例,性價(jià)比才是大規(guī)模應(yīng)用的決定性因素。
·當(dāng)算力成本進(jìn)一步降低,開源模型的性價(jià)比將更加突出。
·開源的優(yōu)勢(shì)還在于更容易成為行業(yè)標(biāo)準(zhǔn)。
·開源的AI開發(fā)工具鏈,對(duì)大模型的國(guó)產(chǎn)化替代意義巨大。
以下為對(duì)話全文:
放棄預(yù)訓(xùn)練,不是能力不夠
觀察者網(wǎng):可以聊聊最近零一萬(wàn)物預(yù)訓(xùn)練團(tuán)隊(duì)并入阿里的事嗎?這是不是意味著,國(guó)內(nèi)頭部大模型公司之間的能力已經(jīng)在分化,零一發(fā)現(xiàn)自己預(yù)訓(xùn)練的效果不夠好?
林旅強(qiáng):完全不是這樣的。零一的團(tuán)隊(duì)很強(qiáng),預(yù)訓(xùn)練出來(lái)的東西也很強(qiáng),去年5月發(fā)布的Yi-Large,10月發(fā)布的Yi-Lightning都很好,尤其是Yi-Lightning,可以說(shuō)是當(dāng)時(shí)時(shí)間點(diǎn)上最強(qiáng)的之一。
但是模型強(qiáng)不強(qiáng),跟商業(yè)上能不能走通是兩回事。零一絕對(duì)不是沒能力做預(yù)訓(xùn)練,而是作為一個(gè)小公司,必須面對(duì)現(xiàn)實(shí)——你投入巨大的資源去做預(yù)訓(xùn)練,能不能做到self sustainable?是不是對(duì)投資人負(fù)責(zé)?
所以一個(gè)公司最終還是要去找到符合商業(yè)規(guī)律的生存之道。
王鐵震:對(duì),我非常同意。我要補(bǔ)充一下,其實(shí)中國(guó)的research非常強(qiáng),這兩年中國(guó)的大模型追得非常快,包括最近的DeepSeek,甚至讓OpenAI都感到一些危機(jī)。
如果說(shuō)中國(guó)跟美國(guó)的頭部模型存在一些差距,我覺得不能說(shuō)是人的問題,主要還是因?yàn)橘Y金的分配、公司的政策方向等等。像零一這樣的中國(guó)公司,有最優(yōu)秀的團(tuán)隊(duì),有開復(fù)老師的領(lǐng)導(dǎo),那么如果給它像OpenAI一樣的資金,它絕對(duì)也能做出同樣好的產(chǎn)品。但是這樣的條件在中國(guó)是很稀缺的。
大部分中國(guó)公司,不可能把無(wú)止境的資金投入到一個(gè)非常燒錢的項(xiàng)目里。在“六小虎”中,所有人一開始都是to b也要做,to c也要做,to developer也要做,foundamental research也要做,但是很快大家就會(huì)發(fā)現(xiàn),我不可能每一件事情都做得好,每一件事情的競(jìng)爭(zhēng)都是非常激烈的,我需要把所有的精力放到某一個(gè)自己很擅長(zhǎng)的事情上面,才能做出最好的效果。
可能零一也經(jīng)歷了這樣一波周期,發(fā)現(xiàn)必須把全部精力集中在做APP,或者專注做to b。我覺得這完全沒有問題,因?yàn)楹苌儆泄灸軌蛳馜eepSeek或者阿里巴巴一樣,有另外賺錢的業(yè)務(wù)去養(yǎng)活不賺錢的foundamental research。
所以我覺得國(guó)內(nèi)做預(yù)訓(xùn)練的公司會(huì)越來(lái)越少,其實(shí)是一個(gè)好事,是更好的資源調(diào)配。想做預(yù)訓(xùn)練的人也可以更集中,資金也可以更集中,可能最后只有四五家模型,但每家都可以得到非常多的資金支持,可以走得更遠(yuǎn)更好。
中國(guó)很多行業(yè)都走過(guò)了類似的路,比如說(shuō)電動(dòng)汽車、光伏,都經(jīng)歷了自然淘汰的過(guò)程,從無(wú)序競(jìng)爭(zhēng)到有序收斂,這是一個(gè)市場(chǎng)比較理想的狀態(tài)。
觀察者網(wǎng):也就是說(shuō)國(guó)內(nèi)的大廠也好,“六小虎”也好,在大模型能力上還沒有顯著差距。
王鐵震:我認(rèn)為還在牌桌上的玩家,水平都沒有太大的差距,有差距的自己已經(jīng)放棄了,所以牌桌上的玩家確實(shí)在減少。
林旅強(qiáng):很多行業(yè)應(yīng)用,也未必非要去做預(yù)訓(xùn)練。例如百川很早就宣布把重點(diǎn)放在醫(yī)療,那么醫(yī)療大模型是不是一定需要做預(yù)訓(xùn)練?基于別人的基座大模型,拿行業(yè)數(shù)據(jù)去做后訓(xùn)練是不是足夠了?
所以退出牌桌的人,也不一定是失敗,而是調(diào)整。所有公司都要找到適合自己的路。
觀察者網(wǎng):那么當(dāng)初為什么大家一擁而上都去做預(yù)訓(xùn)練?是戰(zhàn)略選擇錯(cuò)誤,還是擔(dān)心使用別人的模型,不是好的商業(yè)模式?
林旅強(qiáng):首先,你要向資本市場(chǎng)講一個(gè)故事。2023年上半年,資本市場(chǎng)會(huì)覺得一個(gè)團(tuán)隊(duì)能做預(yù)訓(xùn)練,代表團(tuán)隊(duì)的能力是很扎實(shí)的。
另一個(gè)原因是當(dāng)時(shí)的基座模型還不夠強(qiáng),后續(xù)去做fine-tune的效果也不好,所以只能自己去做基座。
現(xiàn)在,很多大模型效果已經(jīng)好到一定的程度,甚至10B以下的小模型都比當(dāng)時(shí)強(qiáng)很多了,對(duì)很多場(chǎng)景來(lái)說(shuō)完全夠用了。所以大家不會(huì)再盲目追求超大模型。
王鐵震:對(duì),剛開始的時(shí)候,你必須向資本市場(chǎng)證明自己的團(tuán)隊(duì)實(shí)力。只做fine-tune的團(tuán)隊(duì),估值不會(huì)很高,后續(xù)做很多事情就會(huì)非常受限。而且最開始的那段時(shí)間,市場(chǎng)上資金是最充裕的,越往后融資越難,如果開始拿不到足夠資金,后面可能很快就死了。
還有很重要的一點(diǎn),是對(duì)人才的爭(zhēng)奪。那個(gè)時(shí)候大模型人才是相當(dāng)稀缺的,很多公司都需要開出非常高的薪水挖人。
做預(yù)訓(xùn)練更有利于去培養(yǎng)自己的團(tuán)隊(duì)。如果只是做微調(diào),你只能看到世界的一小部分,只有懂預(yù)訓(xùn)練的人才能告訴你,一個(gè)問題到底應(yīng)該用預(yù)訓(xùn)練解決,還是后訓(xùn)練解決。
但在今天這個(gè)時(shí)間點(diǎn),基于很多開源模型去做后訓(xùn)練,已經(jīng)能達(dá)到比較好的效果,預(yù)訓(xùn)練可能就更多是一種情懷了。
最好的大模型,未必要最強(qiáng)
觀察者網(wǎng):那么在今天這個(gè)時(shí)間點(diǎn)上,開源模型跟閉源模型的能力還有差距嗎?
林旅強(qiáng):我想先correct一下這個(gè)問題本身。模型就是模型,不會(huì)因?yàn)樗情_源或者閉源就更強(qiáng)或更弱,模型強(qiáng)弱跟是否開源是完全兩個(gè)維度的事情。
觀察者網(wǎng):但是最早Llama之所以選擇做開源,可能是因?yàn)樗粔驈?qiáng),要通過(guò)開源來(lái)?yè)屖袌?chǎng)。
林旅強(qiáng):開源確實(shí)有利于搶占市場(chǎng),但是它想搶市場(chǎng),跟它夠不夠強(qiáng),不能建立直接關(guān)系?,F(xiàn)在DeepSeek也是開源,難道是因?yàn)樗粔驈?qiáng)?所以我個(gè)人覺得Llama只是開源中一種情況,并不代表開源的本質(zhì)。
開源和閉源的參與者也是動(dòng)態(tài)變化的,比如之前一直閉源的MiniMax,最近突然也做開源了,這并不只是取決于模型強(qiáng)弱。
王鐵震:這是一個(gè)經(jīng)常被問到的問題,最近我剛好也有一些新的想法。
首先就像前面提到的,沒有開源強(qiáng)的閉源模型已經(jīng)死掉了,所以結(jié)果就變成,閉源模型永遠(yuǎn)是大于等于開源模型。
之前我也覺得,開源模型跟最頭部的閉源模型相比,還是有非常大的差距。但是最近DeepSeek發(fā)布的成果,以及國(guó)內(nèi)在推理模型上面的進(jìn)展,都讓我覺得差距沒有那么大了,反而是OpenAI更應(yīng)該感到焦慮。
視頻生成模型也是一個(gè)很好的觀察角度。Sora是一個(gè)閉源模型,它剛出來(lái)的時(shí)候大家都驚嘆,中國(guó)跟它的差距非常大。但是現(xiàn)在大家驚嘆的反而是,Sora怎么一直都像個(gè)期貨,好像還不如中國(guó)的開源模型給力。
所以開源模型是可以很強(qiáng)的。但這個(gè)問題仍然很有價(jià)值,我會(huì)想問,如果開源模型廠商真的做出了比OpenAI更好的模型,它們還會(huì)不會(huì)繼續(xù)開源?整個(gè)開源生態(tài)本身已經(jīng)在收斂,如果再有更多廠商放棄開源預(yù)訓(xùn)練,對(duì)行業(yè)將是巨大損失,因?yàn)闆]有市場(chǎng)競(jìng)爭(zhēng)的話,很難保證大家都還愿意在這個(gè)牌桌上玩。
觀察者網(wǎng):所以仍然可以說(shuō),閉源模型大于等于開源模型?究竟有沒有哪家開源模型,能夠達(dá)到跟OpenAI差不多的能力?
林旅強(qiáng):其實(shí)對(duì)于開發(fā)者跟行業(yè)來(lái)說(shuō),很多開源模型的能力是足夠的。那么在同等能力情況下,如果有開源的選擇,我一定選開源,因?yàn)樾詢r(jià)比就是開源強(qiáng)。
所以你怎么去評(píng)判強(qiáng)不強(qiáng)?論性價(jià)比開源超強(qiáng)。你的問題其實(shí)暗含了一個(gè)假設(shè),認(rèn)為模型能力一定要達(dá)到最強(qiáng),這件事情是很重要的。如果從科研角度或者公司估值的角度,追求最強(qiáng)確實(shí)是有意義的,但是從我們開發(fā)者角度,性價(jià)比高才能普及。
我舉個(gè)例子,PC端操作系統(tǒng),最強(qiáng)的肯定是Windows或者macOS,但是Linux對(duì)于全球行業(yè)的影響力或許更大。你看得到的機(jī)器上跑的都是Windows或者macOS,你看不到的機(jī)器上跑的基本都是Linux,后者的數(shù)量可能更多。
Linux甚至根本不需要一家公司去推動(dòng),它成立一個(gè)基金會(huì),IBM、谷歌都會(huì)捐錢。每家捐幾百萬(wàn)美元,就能換來(lái)持續(xù)可用的操作系統(tǒng),而且不會(huì)被人卡脖子。
所以究竟是Linux最強(qiáng),還是macOS比較強(qiáng),現(xiàn)在已經(jīng)沒有人care這一點(diǎn)了。
觀察者網(wǎng):有支持閉源的人,說(shuō)開源模型是“智商稅”,認(rèn)為即使從成本來(lái)看,閉源也比開源要低。
林旅強(qiáng):我尊重他們的選擇,但我不認(rèn)同這個(gè)結(jié)論,開源相比閉源成本一定是低的。因?yàn)橘?gòu)買一個(gè)閉源模型本身就是很大的支出,在此之外,開源不會(huì)比閉源增加任何成本。
王鐵震:一些現(xiàn)在做閉源的公司,其實(shí)在過(guò)去的時(shí)代也在做開源,對(duì)NLP、OCR等領(lǐng)域都有很大幫助。后來(lái)在大模型領(lǐng)域轉(zhuǎn)向閉源,雖然很可惜,但是一定是經(jīng)過(guò)了深思熟慮,甚至可能也有激烈的內(nèi)部討論。那么一旦選定了技術(shù)路線,對(duì)外也只能這樣說(shuō)。
|舉報(bào)-
違反法律法規(guī) -
垃圾信息、廣告 -
色情、淫穢信息 -
人身攻擊 -
謠言、不實(shí)信息 -
冒充,冒用信息 -
破壞社區(qū)秩序 -
其他 -
涉未成年人有害信息
- 責(zé)任編輯: 張廣凱 
-
基金季報(bào)揭示神秘資金力挺A股:耗資千億增持,至今一股未賣
2025-01-23 16:43 觀網(wǎng)財(cái)經(jīng)-金融 -
國(guó)產(chǎn)“足球巨星”機(jī)器人來(lái)了
2025-01-23 16:27 人工智能 -
一箭18星!長(zhǎng)六改火箭成功發(fā)射千帆極軌06組衛(wèi)星
2025-01-23 16:00 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
1月136款游戲獲批,王者榮耀衍生作品拿下版號(hào)
2025-01-23 11:15 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
高端餐飲年度觀察|西餐日料承壓,中餐持續(xù)走強(qiáng),高處不勝寒
2025-01-23 11:04 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
吳清:力爭(zhēng)大型國(guó)有險(xiǎn)企,每年新增保費(fèi)的30%用于投資A股
2025-01-23 09:20 金融觀察 -
對(duì)抗OpenAI,谷歌向Anthropic追投10億美元
2025-01-22 17:17 人工智能 -
-
出售與輝同行后東方甄選虧近億元,新東方股價(jià)暴跌24%
2025-01-22 16:19 大公司 -
?12306重申加價(jià)搶票是忽悠,購(gòu)票平臺(tái)為何還在賣“加速包”?
2025-01-22 15:22 -
華為數(shù)字能源多位高層變更,年?duì)I收超500億
2025-01-22 15:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
特朗普都提名了哪些人來(lái)管理五角大樓?
2025-01-22 14:42 特朗普 -
-
-
寒武紀(jì)遭前CTO訴訟索賠42.87億
2025-01-21 22:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
萬(wàn)億券商合并新進(jìn)展:海通證券、國(guó)泰君安宣布2月6日起停牌
2025-01-21 21:14 金融觀察 -
DeepSeek又有重大突破?一款未公開大模型展現(xiàn)驚人能力
2025-01-21 18:13 人工智能 -
餓了么推出九項(xiàng)舉措:讓“算法”成為騎手的“辦法”
2025-01-21 18:04 大公司
相關(guān)推薦 -
-
俄高官稱臨時(shí)?;鹬粫?huì)給烏軍喘息,美特使飛抵莫斯科 評(píng)論 27“小馬科斯這么干,菲律賓危險(xiǎn)啊” 評(píng)論 77“歐洲輸了,門戶向中企敞開” 評(píng)論 183緊盯中國(guó),美又一部門擬成立國(guó)安機(jī)構(gòu) 評(píng)論 115普京視察庫(kù)爾斯克,誓言“徹底奪回” 評(píng)論 184最新聞 Hot
-
“歐洲輸了,門戶向中企敞開”
-
“那還是毛澤東時(shí)代的事了,我希望中國(guó)人能回來(lái)”
-
非洲有道“綠色長(zhǎng)城”,“中國(guó)在,就能贏”
-
“怒省1150億?吹牛被打臉了吧”
-
大眾工廠要造坦克了?
-
ICC確認(rèn)關(guān)押,現(xiàn)場(chǎng)畫面曝光…
-
緊盯中國(guó),美又一部門擬成立國(guó)安機(jī)構(gòu)
-
特朗普當(dāng)面“敲打”,“幸好愛爾蘭總理沒說(shuō)太多”
-
普京視察庫(kù)爾斯克,誓言“徹底奪回”
-
加拿大想擠進(jìn)歐盟?“受寵若驚”
-
“特朗普肯定會(huì)沖中國(guó)瞎嗶嗶,但早沒戲唱了”
-
王樹國(guó)談退休后出任福耀科技大學(xué)校長(zhǎng):不收一分錢工資,一個(gè)情結(jié)
-
“俄高層消息人士:普京很難同意”
-
“不會(huì)承認(rèn)任何被占領(lǐng)土屬于俄羅斯,這是紅線”
-
俄軍正占上風(fēng),美烏這時(shí)談?;鹌站┠芡鈫??
-
如何應(yīng)對(duì)美國(guó)聯(lián)俄制華的詭計(jì)?拉夫羅夫回應(yīng)
-