-
訊飛劉慶峰:今天,中國的大模型底座能力到底怎么樣?
發(fā)展中國通用人工智能,一定要有大模型的底座能力
在去年9月份發(fā)布的GPT-4V,OpenAI大模型在圖文識別和理解分析能力上,上了一個(gè)大臺階,隨后11月推出語音識別大模型Whisper,今年2月又推出了文生視頻大模型Sora ,今年5月推出GPT-4o,看起來是一個(gè)又一個(gè)的熱點(diǎn),但實(shí)際上還是依托GPT-4的底層通用大模型能力。
以Sora為例,并不是外界所說的“對物理世界的認(rèn)知進(jìn)一步加強(qiáng)了”,而是通過GPT-4V的理解能力和生成能力,結(jié)合GPT-4V的“打標(biāo)簽”能力、傳統(tǒng)的文生視頻能力,用GPT方法做了重寫,從而實(shí)現(xiàn)了Sora。本質(zhì)上,與大模型在醫(yī)療領(lǐng)域做一個(gè)醫(yī)療專用模型,在教育領(lǐng)域做一個(gè)教育專用模型并沒有本質(zhì)差別,只要有算力、有數(shù)據(jù),其實(shí)沒有真正核心技術(shù)的壁壘。
我們要發(fā)展中國通用人工智能,整個(gè)產(chǎn)業(yè)一定要有大模型的底座能力,我們有很多人可以做專用系統(tǒng),很多人可以做我剛才說的大模型所調(diào)用的各種專用的小系統(tǒng)。但是國家不能沒有自主可控的通用大模型底座,這決定了我們本輪通用人工智能發(fā)展到底能走多遠(yuǎn)。我們這么熱熱鬧鬧的社會熱點(diǎn),這么多的投入,將來能不能真的走到紅利兌現(xiàn)那一天,我覺得底座能力是至關(guān)重要的。
今天所有的企業(yè)一定要科學(xué)地認(rèn)識到大模型能力的邊界,我們可以舉出很多成功的例子,也可以舉出很多的坑、很多不行的地方,每一家都是如此,所以我們要給統(tǒng)計(jì)數(shù)據(jù)。比如醫(yī)療八十幾分是什么概念,國家執(zhí)業(yè)醫(yī)師資格考試60分就可以通過了,我們要考協(xié)和醫(yī)學(xué)院等分?jǐn)?shù)最高的醫(yī)學(xué)院,七十幾分也就可以上了。大模型的能力并不是包治百病,并不是什么任務(wù)都能100%完成。但是可以大概把它分成這幾塊,一個(gè)是叫一般難度任務(wù),用通用大模型底座就直接可做,比如說代碼、文案、翻譯這些,會用到文本生成、摘要這些能力,直接用底座就可以滿足應(yīng)用。
中等難度任務(wù)涉及了知識庫、深度的客服,它需要定制優(yōu)化后才能用,這一般來說必須要做SFT的專門優(yōu)化,很多地方可以做到,現(xiàn)在在很多客服行業(yè)可以大幅提升效率。
還有很多高難度任務(wù),比如說高難度數(shù)學(xué)推理、多階的推理類的知識問答,以及開放域的通用智能體等,實(shí)際上是非常難的,需要更大的模型,還需要專門的算法去摸索,在這些領(lǐng)域中,它具有很強(qiáng)的不確定性。所以今天我們認(rèn)清這個(gè)邊界,每個(gè)企業(yè)就可以知道自己應(yīng)該怎么去做。
實(shí)際上,今天企業(yè)要探討的話題是我們怎么能用更少的算力、更高的效率來打造我們的專屬模型和專屬應(yīng)用。我們企業(yè)可以拿通用底座來做自己的專用行業(yè)模型,一般來說一個(gè)月就可以上線,在底座能力上進(jìn)一步提升。底座如果60分,專業(yè)模型可能會做到80分,然后有了專用的行業(yè)模型,每個(gè)企業(yè)或者企業(yè)的不同崗位,在針對私域的IT語料加上高質(zhì)量的微調(diào),又可以進(jìn)一步提升,一周就可以完成。所以,我們現(xiàn)在希望與很多龍頭企業(yè)打造行業(yè)模型,提供給行業(yè)內(nèi)所有上下游公司。
若GPT-5發(fā)布,差距會有多大?
今天人工智能技術(shù)的發(fā)展絕不是一家公司可以把所有事情都做完的,在這個(gè)時(shí)代,做帝國注定要衰落,只有生態(tài)才能生生不息;必須是自主可控的繁榮生態(tài),才有中國通用人工智能大未來。
我非常高興地向大家報(bào)告,從今年1月30日訊飛星火V3.5發(fā)布以來,我們的開發(fā)者團(tuán)隊(duì)持續(xù)高速增長,目前已經(jīng)增長到702萬,這都是實(shí)名認(rèn)證的開發(fā)者團(tuán)隊(duì)。海外開發(fā)者數(shù)量從34萬增加到40萬,大模型的直接相關(guān)開發(fā)者達(dá)到了57萬,這些數(shù)據(jù)都還在快速增長中。
面向下一階段的人工智能的發(fā)展,這一波通用人工智能浪潮,我們要打造新的生態(tài)。特別要關(guān)注到的,第一是源頭技術(shù)生態(tài)。科大訊飛針對幾百萬開發(fā)者團(tuán)隊(duì),我們希望只要有比較好的AI能力,不論是高校還是創(chuàng)業(yè)企業(yè),都可以集成在我們的底層平臺上,讓幾百萬開發(fā)者團(tuán)隊(duì)都能夠用起來。
過去18個(gè)月,用過我們?nèi)斯ぶ悄苣芰Φ莫?dú)立終端已經(jīng)突破40億。我們把源頭技術(shù)生態(tài)打開來,讓更多的英雄有用武之地。今天人工智能非常重要的一個(gè)特點(diǎn)是大平臺加上英雄主義,所以我們把源頭技術(shù)生態(tài)打開。智能體生態(tài)讓無論是企業(yè)每個(gè)崗位的人,可以做自己崗位的助手,也可以做自己的個(gè)性化助手,做完以后都可以分享出來。在我們的平臺上,我們將來會設(shè)計(jì)分享模式和商業(yè)機(jī)制,從而形成智能體的生態(tài)。只要你懂場景,只要你愿意自己去試,試完成功了,你就可以發(fā)布到我們的智能體生態(tài)上,讓所有的一線洞察能力和經(jīng)驗(yàn)成為整個(gè)商業(yè)體中的一環(huán)。還可以有應(yīng)用生態(tài),用原來的開發(fā)者生態(tài)來做各種應(yīng)用,無論是創(chuàng)業(yè),還是企業(yè)內(nèi)部的應(yīng)用。去年我們新增的幾百萬開發(fā)者團(tuán)隊(duì)中,有50%以上是企業(yè)應(yīng)用。
最后行業(yè)生態(tài)是希望跟各個(gè)行業(yè)里面的龍頭企業(yè)一道來打造整個(gè)行業(yè)模型,然后把這個(gè)行業(yè)模型提供給行業(yè)里面的生態(tài)伙伴來共享產(chǎn)業(yè)收益,目前我們已經(jīng)和現(xiàn)在很多龍頭企業(yè)在做這件事。
從源頭智能體開發(fā)到行業(yè)生態(tài),在推動(dòng)的過程中,特別重要的是一定要底座技術(shù)的完全自主可控,否則可能我們就把大樓建在別人的院子里,建在沙灘上,隨時(shí)會倒塌,要真正做到軟硬件一體化,才能更深度地落地。
在這樣大的發(fā)展過程中,我們一定要科學(xué)理性地認(rèn)識到中美科技的綜合差距。今天我們說訊飛星火V4.0對標(biāo)GPT-4 turbo是全方位對標(biāo)。但是我們同時(shí)要看到,一旦GPT-5發(fā)布,因?yàn)樗哪P统叽绺?、?xùn)練時(shí)間更長、數(shù)據(jù)更多,又會把這個(gè)差距給拉開,甚至拉到一年以上。
當(dāng)然,我們有信心快速追趕,而且是在完全國產(chǎn)算力自主可控算法和數(shù)據(jù)基礎(chǔ)上來追趕,保證不出現(xiàn)代差,保證極限情況下,能夠頂上扛上。我們既要認(rèn)識到差距,又要有充分的信心,要能夠科學(xué)理性地給出從源頭技術(shù)、到生態(tài)、到產(chǎn)業(yè)應(yīng)用落地的一整套打法,要以長期主義來打造真正自主可控的AI產(chǎn)業(yè)生態(tài)。
- 責(zé)任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對中國提供API服務(wù),周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國科學(xué)家實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測
2024-06-25 18:20 科技前沿 -
習(xí)近平代表黨中央、國務(wù)院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國國會為何瞄準(zhǔn)這家中國企業(yè)
2024-06-25 09:54 -
2023年度國家科學(xué)技術(shù)獎(jiǎng)勵(lì)名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個(gè)問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國家最高科技獎(jiǎng)
2024-06-24 10:32 科技前沿 -
我國科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國重復(fù)使用運(yùn)載火箭首次10公里級垂直起降飛行試驗(yàn)成功
2024-06-23 14:58 航空航天 -
純度達(dá)99.9%!中國團(tuán)隊(duì)實(shí)現(xiàn)海上風(fēng)電驅(qū)動(dòng)海水制氫
2024-06-23 08:07 觀察者頭條 -
全球首臺!這一重要裝備研制成功
2024-06-22 13:09 中國精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國科學(xué)家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會7月4日開幕,特色亮點(diǎn)搶先看!
2024-06-20 16:00 2024世界人工智能大會 -
我國首個(gè)工業(yè)用途核能供汽項(xiàng)目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當(dāng)于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國精造 -
全球首臺全高溫超導(dǎo)托卡馬克裝置在上海建成運(yùn)行
2024-06-19 08:15 -
“美國在核電技術(shù)上落后中國10-15年”
2024-06-18 16:42
相關(guān)推薦 -
最新聞 Hot
-
“某些國家話說得很滿卻沒行動(dòng),中國正相反”
-
“我們幾乎轟炸了整個(gè)中東,卻一無所獲”
-
布林肯:美國的系統(tǒng)已經(jīng)崩潰
-
白宮把他這段發(fā)言記錄改了,共和黨人:涉嫌違法
-
“美國在糧食安全上的砝碼少了,中國安心了”
-
他無視北約:我們愛見誰就見誰
-
比美國更快?“這將成為中國的‘斯普特尼克時(shí)刻’”
-
哈里斯:特朗普一句話冒犯了女性,冒犯了所有人
-
詹姆斯:支持哈里斯
-
秘密赴美訓(xùn)練卻被美軍曝光,臺當(dāng)局“頗感頭痛”
-
“中國越抓緊,西方越焦慮”
-
“中國工業(yè)制造規(guī)模是美國三倍!不拉上盟友,怎么競爭?”
-
面對恐怖主義,美媒卻如此挑撥中國和“巴鐵”
-
德國外長訪華遭冷落?真相是…
-
美媒發(fā)現(xiàn)中國雙航母“亮點(diǎn)”:殲15B和殲15D已服役
-
以色列拿到情報(bào):伊朗要?jiǎng)邮至耍蛟诿绹筮x前
-