-
張維為《這就是中國》第197期| 人類智能時代:從中華文明中汲取智慧
孫茂松:
我長期從事人工智能研究,現(xiàn)在嘗試從技術(shù)角度延展談一下。
去年年底ChatGPT異軍突起、一鳴驚人,標(biāo)志著通用人工智能開始走進(jìn)人類的視野。而這一點,在一年以前還是不可想象的。
下面簡單討論一下ChatGPT的主要技術(shù)特點。它的核心算法是“下一個詞預(yù)測”,是由這個基本策略驅(qū)動的語言生成模型,貌似簡單,但其實不簡單。
舉個例子,你隨便給機器一句話,然后在任何一個地方停下來,比如說,我昨天晚上吃了?!白蛱焱砩铣粤恕苯猩衔?,給定這個上文去猜下一個詞應(yīng)該是什么詞,這叫“下一個詞預(yù)測”。但下一個詞我是告訴電腦了,就是“飯”,所以算法就會調(diào)動它的人工神經(jīng)網(wǎng)絡(luò)機制,使得下一個詞出現(xiàn)的應(yīng)該是“飯”。
聽起來就這么簡單,但“把這個事告訴它”這件事,實際上是一個了不起的策略,叫自監(jiān)督學(xué)習(xí)。不需要人告訴它,機器自己就知道答案。這一點保證了這個算法可以對互聯(lián)網(wǎng)上任何一個句子來做這個操作,不需要人的絲毫介入。
chatGpt/資料圖
我在互聯(lián)網(wǎng)規(guī)模的語料庫上去統(tǒng)計,就會得到不同概率分布,比如我昨天晚上吃了“飯”,它有一個概率分布,比如說3.5%;我昨天晚上吃了“菜”,比如說2.8%;我昨天晚上吃了“桌子”,這個概率分布一下就變很小。總之,你可以得到一個給定了上文、它下一詞的概率分布。那么,這大概有多少詞呢?詞典有多大,它就有多大。比如,《現(xiàn)代漢語詞典》大概有五六萬詞,它就有五六萬個選項。比如你要基于字來生成,《康熙字典》四萬八千個字左右,它就有四萬八千個選項。靠著這個大數(shù)據(jù),概率統(tǒng)計就可以做得比較準(zhǔn)確。
如果再往前挪一個詞,上文就變了。比如“我昨天晚上吃了北京”,第一你知道它肯定沒說完,第二大概率后面就應(yīng)該出現(xiàn)“烤鴨”“烤肉”這類詞?!翱绝啞钡母怕饰夜烙嬆艿桨俜种H绻f“我昨天晚上吃了上?!?,那后面出現(xiàn)“小籠包”,也是大概率;第二估計是上海小餛飩。這樣它的分布就變了。所以在大數(shù)據(jù)的加持下,我任意給定一個上文,就會得到一個比較合理的下一個詞的概率分布。這一點實際上是了不得的,因為上文是無限的。
這件事實際上,一是靠大數(shù)據(jù),再一個是靠大模型,即深層神經(jīng)網(wǎng)絡(luò),也就是基于Transformer架構(gòu)的深層神經(jīng)網(wǎng)絡(luò),才可以把這件事做出來。當(dāng)然,要做出來還需要大算力。大家都很熟悉,要做出來,這“三個大”缺一不可。一旦有了這套東西,你就可以讓機器生成任何你想生成的句子。這是它的一個基本機理。
這種生成式算法具有強大的文本內(nèi)容生成能力。舉個例子,比如我們現(xiàn)在讓機器寫五言律詩,每句五個字,一共四十個字。你對每一個字的選擇,就好像你走路走到一個路口,有多少個分叉呢?比如《康熙字典》四萬八千個字,大概是四萬八千個選項,這里邊有的路比較寬,那接續(xù)比較自然;有些路是很窄的,可能根本不能接續(xù),那四萬八千個選項不可能都是通暢的。
我假設(shè)平均一個路口后邊有一百個字的選擇,這應(yīng)該是比較保守的估計,那么能夠產(chǎn)生多少首不同的比較通順的五律,我們可以簡單算一算,一個路口,如果有一百種可能性,總共連續(xù)四十個路口就是一百的四十次方,理工科同學(xué)一看這個數(shù)就害怕了。給大家一個形象的比較,全宇宙中的原子加起來大概是這個數(shù)。換句話說,我們?nèi)祟愖怨诺浇窳鱾飨聛淼奈迓刹怀^五十萬首,和我剛才講的數(shù)相比,這五十萬首只是什么?不能叫滄海一粟,叫“銀河系一粟”。所以它有巨大的創(chuàng)作空間,大多數(shù)五律我們?nèi)祟惗紱]有來得及寫出來。
這種方式就使得我們的創(chuàng)作形式產(chǎn)生了變化。比如以前要寫詩,你自己殫思竭慮,會去琢磨怎么寫出新意。但人工智能這個模型就變成,我可以把整個空間生成出來,天文數(shù)字的五律詩詞生成出來,然后你來挑。如果你對其中個別字不滿意,就去改一改,所以它的模式就變了。挑的過程既可以讓人去挑,也可以讓機器去挑。比如說我們?nèi)绻讲砜冢驼覍挼牡廊プ?,肯定是通順的,但新意就不夠;如果按窄的道路去走,非常具有新意,但有可能不通順??梢?,這種模型的創(chuàng)造能力不可限量。
以ChatGPT為典型代表的通用人工智能會催生重大的技術(shù)和產(chǎn)業(yè)創(chuàng)新。比如ChatGPT和搜索引擎結(jié)合就很有可能催生下一代搜索引擎。它也可能帶來產(chǎn)業(yè)生態(tài)的重新洗牌,比如ChatGPT最近把插件和一些大的知名公司合作,比如跟旅游公司合作,用戶去訂酒店訂機票的時候,就用人類語言去跟它講,可以表達(dá)非常復(fù)雜的訴求,假設(shè)我想在王府井附近訂一個酒店,最好離購物區(qū)近一點,但又不要太吵,價錢適中,這個訴求以前可能需要費半天勁才能解決,但如果和ChatGPT合作,就有可能比較好地理解你的意愿,然后快速給你訂到你希望的酒店。剛開始可能還不太行,但你在跟它的交互過程中,最后訂了這家酒店,相當(dāng)于你給它做了深層次的語義標(biāo)注,它就會越做越好??梢栽O(shè)想它如果能夠很好地理解用戶訂酒店的訴求,一句話把這事搞定,那么其他的辦旅游的網(wǎng)站應(yīng)該機會就不大了?,F(xiàn)在ChatGPT和衣、食、住、行、用、教育等行業(yè)有影響的網(wǎng)站結(jié)合,未來會影響行業(yè)生態(tài),可能導(dǎo)致行業(yè)生態(tài)的重新洗牌。這是更值得我們警惕的,因為生態(tài)競爭是最高形態(tài)的競爭。
4月,中共中央政治局召開會議,提出要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風(fēng)險,不管我們愿意還是不愿意,人類通用人工智能之路已經(jīng)開啟,它是不以人的意志為轉(zhuǎn)移的。正如張維為教授所指出的,前路充滿著巨大的機遇和挑戰(zhàn),確定性與不確定性并存,這將是對人類智慧的一次重大考驗。我就講到這里,謝謝大家。
【圓桌討論】
主持人:謝謝兩位教授的演講,因為生成式人工智能的出現(xiàn),也讓普通人覺得人工智能離我們并不遙遠(yuǎn)。想問一下孫教授,人工智能將來到底會怎么樣地進(jìn)入我們的生活?
孫教授:其實只要是人和機器用人類的語言打交道,所有這些場合它都會發(fā)揮重要作用。比如說現(xiàn)在中國老齡化程度越來越嚴(yán)重,老年人很孤獨,如果設(shè)計一個人形機器人,配上ChatGPT,讓機器人去理解并根據(jù)人的某種偏好,來產(chǎn)生回答,就可以用作陪伴老人的機器人,而且是個性化的。這就是一個很大的產(chǎn)業(yè)。
華為發(fā)布盤古大模型3.0
主持人:因為我們都知道中國正在邁入一個老齡化社會,未來健康產(chǎn)業(yè)是巨大的一片藍(lán)海,人工智能在這個領(lǐng)域里會有很大的作用。
張教授:最近華為發(fā)布的盤古大模型,賦能千行百業(yè),比方說制藥業(yè),它可以降低藥物研發(fā)成本百分之七十,以最快速度從海量藥物分子篩選出最適合的小分子。而且關(guān)鍵是ChatGPT用的是英偉達(dá)的芯片,盤古用的是華為自己研發(fā)的昇騰芯片,這也是一個重要的突破。
-
本文僅代表作者個人觀點。
- 責(zé)任編輯: 朱敏潔 
-
如果一家公司或者一個人,利用人工智能把整個世界毀滅……
2023-08-12 09:45 人工智能 -
碧桂園已籌備債務(wù)重整 近期啟動相關(guān)程序
2023-08-11 08:17 觀網(wǎng)財經(jīng)-房產(chǎn) -
“為了這組高清圖,我們前后花了10年時間”
2023-08-10 08:24 -
LK-99只是電阻很高的劣質(zhì)材料?北大等團(tuán)隊研究結(jié)果公布
2023-08-08 22:05 -
香港大學(xué)獲822.6毫克嫦娥五號月壤樣本
2023-08-08 14:12 香港 -
國產(chǎn)薄煤層采煤機打破世界紀(jì)錄
2023-08-08 07:45 科技前沿 -
美國復(fù)現(xiàn)核聚變點火,并突破凈能量增益紀(jì)錄
2023-08-07 12:04 科技前沿 -
可穿戴!我國科學(xué)家率先打造出有彈性的鐵電材料
2023-08-04 09:38 科技前沿 -
“如果超導(dǎo)這么容易做,那就讓大家土法煉鋼去”
2023-08-03 10:59 科技前沿 -
專家:韓國團(tuán)隊公布的超導(dǎo)體“極大概率”不能實現(xiàn)室溫超導(dǎo)
2023-07-30 18:28 -
韓團(tuán)隊室溫超導(dǎo)開啟人類新紀(jì)元?3小時提交兩篇論文,樣品被指有瑕疵
2023-07-28 08:22 科技前沿 -
中國科學(xué)院上海免疫與感染研究所掛牌,取代原上海巴斯德所
2023-07-27 15:45 -
專訪英特爾高管:量子計算產(chǎn)業(yè)化,還有哪些“坑”要填?
2023-07-24 09:53 觀網(wǎng)財經(jīng)-科創(chuàng) -
我國載人登月火箭主發(fā)動機試車連續(xù)成功
2023-07-23 20:03 航空航天 -
我國成功發(fā)射四象01星等4顆衛(wèi)星
2023-07-23 11:24 航空航天 -
我國載人登月火箭主發(fā)動機完成飛行任務(wù)要求驗證
2023-07-23 09:31 航空航天 -
突破國外長期封鎖,國產(chǎn)核磁共振儀實現(xiàn)量產(chǎn)
2023-07-22 22:00 -
專訪:除了使用最強光刻機,英特爾制程反超臺積電還有哪些招數(shù)?
2023-07-22 15:22 觀網(wǎng)財經(jīng)-科創(chuàng) -
神十六航天員圓滿完成出艙任務(wù)
2023-07-20 21:50 航空航天 -
電磁彈射微重力實驗裝置(4秒)啟動試運行
2023-07-19 15:06 科技前沿
相關(guān)推薦 -
最新聞 Hot
-
普京:要不了多久,歐洲會繼續(xù)對特朗普“搖尾巴”
-
墜毀“黑鷹”女飛行員曾任拜登軍事社交助理,飛行時長450小時
-
特朗普承認(rèn):關(guān)稅也許會讓美國人“痛苦”
-
“史上最愚蠢的貿(mào)易戰(zhàn)!”
-
加拿大群情激奮:報復(fù)紅州,報復(fù)特斯拉!
-
美國一客機發(fā)動機起火,乘客被緊急疏散
-
要被特朗普關(guān)稅大棒掄到,歐盟這時候想到中國了?
-
“霸榜全球140個市場”,拉新最多的是…
-
他罕見“認(rèn)錯”:在這方面,我們一直站在歷史錯誤一邊
-
“政治清洗”?數(shù)千名FBI特工被“拉清單”
-
他寫的這篇小作文,竟是英偉達(dá)市值蒸發(fā)6000億美元的重要催化劑
-
他倆首會面,“談了DeepSeek和AI芯片出口”
-
五角大樓下手,“有些員工為使用連上中國服務(wù)器”
-
果然,臺當(dāng)局又跳了出來
-
美媒復(fù)盤:為何中國科技一再讓西方措手不及?
-
67人無一生還,特朗普暗示“原因”
-