-
劉聰:代表人工智能第三次浪潮的快速發(fā)展,這是中國(guó)人的原創(chuàng)
最后更新: 2024-07-26 16:16:00與我們競(jìng)爭(zhēng)的是國(guó)際上的語音識(shí)別王者賽輪思,前身為被微軟收購的Nuance。在車企的交互測(cè)試?yán)?,我們的系統(tǒng)效果全面領(lǐng)先賽輪思。同時(shí),由于中國(guó)過去幾年在汽車出海上表現(xiàn)優(yōu)秀,本項(xiàng)目也經(jīng)歷了多語種的交互效果評(píng)測(cè),國(guó)內(nèi)現(xiàn)在出海的汽車,其車載語音交互系統(tǒng)絕大部分選擇的是訊飛的多語種智能語音交互系統(tǒng)。
華為的評(píng)測(cè)在當(dāng)時(shí)主要是考慮面向歐洲的手機(jī)出海,所以它的評(píng)測(cè)項(xiàng)目主要是手機(jī)的語音助手。我們的主要對(duì)手就不再是賽輪思,而是谷歌;華為采取的同樣是端到端產(chǎn)品層面的測(cè)試。當(dāng)時(shí)評(píng)測(cè)了英語、法語、西班牙語、意大利語等語種,訊飛也都全面超過谷歌,最終由我們提供了整個(gè)系統(tǒng)。所以,在去年全球1024開發(fā)者節(jié)大會(huì)上,華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍提到目前華為公司在全球所有使用的智能終端的語音技術(shù),都是來自于科大訊飛,而且不僅僅是中文。
這些企業(yè)在產(chǎn)品層面的遴選都非常嚴(yán)格,既要求效果又要求效率,還有可靠性。他們卻不約而同地選擇訊飛,充分證明了我們站在客戶視角做出的端到端效果和體驗(yàn)很優(yōu)秀。
心智觀察所:我看到有提出多語種技術(shù)存在一個(gè)卡脖子的問題,請(qǐng)問這個(gè)問題的由來是硬件層面還是算法層面?然后,訊飛提出了一種多語種統(tǒng)一音素韻律體系,并提到一個(gè)基于語族分組的共享建模技術(shù),請(qǐng)問這些技術(shù)又是一個(gè)怎樣的情況?
劉聰:某種程度上,這次的項(xiàng)目獲獎(jiǎng)與卡脖子非常相關(guān),許多國(guó)產(chǎn)化項(xiàng)目其實(shí)都是在這個(gè)背景之下催生的。
卡脖子既包含軟件和硬件。硬件在剛才已經(jīng)講述了一些,例如從2019年斷供人工智能的關(guān)鍵芯片,后來愈演愈烈;2022年10月,美國(guó)再一次極限施壓,升級(jí)對(duì)華半導(dǎo)體管制,導(dǎo)致我們基本上無法購買任何美國(guó)生產(chǎn)的硬件。另外在芯片層面,隨著大模型的崛起,美國(guó)也進(jìn)一步加大對(duì)硬件層面卡脖子的力度。
在軟件層面,美國(guó)直接掐斷了多語種語音技術(shù)的支持,很多語種技術(shù)服務(wù)無法使用,使得我國(guó)每年龐大的手機(jī)、家電出口受限。當(dāng)然,訊飛的多語種技術(shù)也因此受到了很大的影響,訊飛在中文語音領(lǐng)域全球領(lǐng)先,在數(shù)據(jù)方面有多年儲(chǔ)備,但是我們當(dāng)時(shí)關(guān)注的60多個(gè)語種不可能都像中文這樣去投入:一是因?yàn)槎嗾Z種數(shù)據(jù)資源缺乏,很多語種沒有那么多數(shù)據(jù);二是即使我們能夠獲得一些小語種的數(shù)據(jù),但是每個(gè)語種的知識(shí)及語言專家都很難找,知識(shí)匱乏。
為了應(yīng)對(duì)小語種智能語音系統(tǒng)構(gòu)建所面臨的知識(shí)匱乏、訓(xùn)練數(shù)據(jù)稀缺等難題,除了前面提到的語音屬性解耦共性技術(shù)在多語種領(lǐng)域有一些應(yīng)用之外,我們?cè)诙嗾Z種共享建模關(guān)鍵技術(shù)上也實(shí)現(xiàn)了突破:設(shè)計(jì)了全新的多語種通用音素體系RGP(Rough Global Phone)和基本語言單元,結(jié)合字音轉(zhuǎn)換自動(dòng)學(xué)習(xí)和人類語言專家的校驗(yàn)反饋,讓不論哪個(gè)語種的詞語都能使用這套共性的音素體系,實(shí)現(xiàn)了多語種統(tǒng)一音素韻律體系的構(gòu)建;
再通過基于元學(xué)習(xí)的多語種預(yù)訓(xùn)練和基于語族分組的多語種共享建模——通俗地說,就是將不同的小語種進(jìn)行分類,找到同類語種的共同規(guī)律,進(jìn)行分析建模和訓(xùn)練。基于以上技術(shù)創(chuàng)新,我們使需要的小語種數(shù)據(jù)數(shù)量大大降低,最終也顯著提升了小語種語音系統(tǒng)性能。
心智觀察所:關(guān)于這次獲獎(jiǎng),您剛才也提到和中科大的合作,從校企合作的這個(gè)角度來說,攻克核心技術(shù),促進(jìn)復(fù)合人才發(fā)展,推動(dòng)科技成果轉(zhuǎn)化,請(qǐng)問從您的角度來說,您覺得還有哪些工作是可以總結(jié)或是需要繼續(xù)完善,繼續(xù)去進(jìn)一步做?
劉聰:將本次獲獎(jiǎng)算在內(nèi),訊飛一共三次獲得國(guó)家科技進(jìn)步獎(jiǎng)。每次獎(jiǎng)項(xiàng)都凝結(jié)了十年左右的積累和突破,我們自稱“十年磨一劍”。
訊飛從成立之初,就非常關(guān)注產(chǎn)學(xué)研。當(dāng)年,訊飛創(chuàng)始人、董事長(zhǎng)劉慶峰等六名在校大學(xué)生加上十二名員工,一共十八個(gè)人創(chuàng)業(yè)成立科大訊飛,我們也是第一家在校大學(xué)生創(chuàng)業(yè)之后成功上市的企業(yè)。如此看到,訊飛源頭的核心技術(shù)來自中科大,特別是王仁華老師建立起的我國(guó)最早的人機(jī)語音通訊實(shí)驗(yàn)室。除了中科大之外,訊飛也整合了源頭核心技術(shù)資源,包括語言所、聲學(xué)所以及后來清華大學(xué)等,將國(guó)內(nèi)在語音方面最有優(yōu)勢(shì)的產(chǎn)學(xué)研資源全都集中。此后,我們也不斷基于研究方向和許多外部實(shí)驗(yàn)室合作。故此,我們從創(chuàng)立之初到現(xiàn)在一直高度重視產(chǎn)學(xué)研。
我們現(xiàn)在產(chǎn)學(xué)研模式與成立初期有一些變化。早期我們的產(chǎn)業(yè)模式更多是一個(gè)橫向項(xiàng)目,這意味著每當(dāng)企業(yè)有一個(gè)任務(wù)需要高校的創(chuàng)新能力時(shí),就需要高校從原始創(chuàng)新的角度去解決這樣的任務(wù)。但是,我們現(xiàn)在的問題大多源于產(chǎn)業(yè)里很復(fù)雜的一些問題,解決它們也需要一個(gè)比較復(fù)雜的產(chǎn)業(yè)鏈。所以雖然橫向項(xiàng)目仍然存在,但現(xiàn)在很多的組織方式變?yōu)楹透咝9餐陥?bào)國(guó)家的項(xiàng)目。企業(yè)的問題中可能會(huì)解析出一些不同的技術(shù)難題,有的需要原始創(chuàng)新、適合高校去研究;有些需要工程能力或系統(tǒng)性創(chuàng)新能力,適合企業(yè)去完成,因此現(xiàn)在校企之間變成了一個(gè)更大的創(chuàng)新聯(lián)合體概念。
多年以來,我們一直堅(jiān)持產(chǎn)學(xué)研,但伴隨著科技創(chuàng)新在不同時(shí)代所要解決的問題不同,企業(yè)、高校在其中扮演的角色也一直在變化。
那么,我們訊飛產(chǎn)學(xué)研的邊界在哪里?從訊飛這些年的經(jīng)驗(yàn)來講,我們的業(yè)務(wù)部門在做“今天的事”——在產(chǎn)品研發(fā)過程中,我們不可能在技術(shù)仍然是“期貨”狀態(tài)時(shí)就馬上推出產(chǎn)品,產(chǎn)品推出時(shí)技術(shù)應(yīng)該已經(jīng)成熟,使得用戶在使用體驗(yàn)之后,技術(shù)還能夠持續(xù)迭代;
訊飛研究院則是在研究“明天的事”。研究院會(huì)進(jìn)行技術(shù)孵化,例如做出一個(gè)技術(shù)demo給大家展示,雖然還沒有進(jìn)入產(chǎn)品和應(yīng)用,但是有了技術(shù)雛形。此后結(jié)合應(yīng)用場(chǎng)景、產(chǎn)品的具體需求,這些技術(shù)會(huì)繼續(xù)打磨迭代,直至真正應(yīng)用;
高校所考慮的甚至更加長(zhǎng)遠(yuǎn)一點(diǎn),想的是“后天的事”。有些高校里的技術(shù)可能仍然存在于論文之內(nèi),離工程化還有一定的距離,但卻代表了下一代,甚至是下下一代產(chǎn)品的技術(shù)可能與方向。
所以,我們需要分配好我們的產(chǎn)學(xué)研資源,在企業(yè)我們強(qiáng)調(diào)技術(shù)的應(yīng)用落地,在研究院里完成技術(shù)的預(yù)研的孵化,在學(xué)校里探索布局下一代前瞻技術(shù)。
訊飛研究院上一任院長(zhǎng)胡國(guó)平曾經(jīng)提出過一個(gè)理念:臺(tái)階的重要性,意思是對(duì)于企業(yè)來說,如果等一個(gè)技術(shù)完全成熟之后再去布局,可能就會(huì)為時(shí)已晚;所以在技術(shù)不斷進(jìn)步的前提下,上一個(gè)臺(tái)階技術(shù)相對(duì)成熟,我們就要預(yù)估技術(shù)進(jìn)步的未來趨勢(shì),以及能夠達(dá)到的具體程度,提前布局下一個(gè)臺(tái)階里更高難度的技術(shù)和更廣闊的應(yīng)用場(chǎng)景。
打個(gè)比方,我們2010年推出了訊飛輸入法,開啟語音輸入的時(shí)代。但大家使用語音輸入法的時(shí)候一般是自己思考一下再說出來,這種場(chǎng)景下的語音識(shí)別難度顯然比不上兩人聊天、多人開會(huì)。雖然當(dāng)時(shí)在深度學(xué)習(xí)技術(shù)的加持下,語音識(shí)別水平有了顯著提升,但應(yīng)用到會(huì)議場(chǎng)景準(zhǔn)確率就會(huì)驟降,因此2011、2012年我們迭代訊飛輸入法的時(shí)候開始思考,如何讓語音識(shí)別技術(shù)拓展到訪談、會(huì)議等場(chǎng)景里應(yīng)用。
2015年時(shí),訊飛輸入法效果已經(jīng)非常不錯(cuò),那一年我們?cè)谀昴┑陌l(fā)布會(huì)上又推出了語音轉(zhuǎn)寫技術(shù)的成果——訊飛聽見,全程將發(fā)布會(huì)上劉慶峰董事長(zhǎng)的發(fā)言進(jìn)行精準(zhǔn)的轉(zhuǎn)寫,實(shí)現(xiàn)了技術(shù)突破。
此后,我們又逐漸迭代技術(shù),并且基于此推出了錄音筆等智能硬件,訊飛聽見也服務(wù)了越來越多的重要大會(huì),并且在語音轉(zhuǎn)寫之外還實(shí)現(xiàn)了翻譯等功能。今年,訊飛聽見已經(jīng)服務(wù)全國(guó)政協(xié)兩會(huì)六周年,全面覆蓋人大政協(xié)各個(gè)駐地會(huì)議三周年,訊飛聽見智慧簡(jiǎn)報(bào)系統(tǒng)助力了兩會(huì)期間駐地的記錄服務(wù)工作,同時(shí)還幫助數(shù)十家媒體的多位記者采訪記錄、高效出稿。
我們今天之所以能夠達(dá)到這種水平,離不開之前所設(shè)置的“臺(tái)階”。所以要基于技術(shù)發(fā)展的速度,合理地預(yù)判趨勢(shì)來提前做產(chǎn)業(yè)轉(zhuǎn)化的布局。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 武守哲 
-
歐盟港停滿中國(guó)車?“產(chǎn)能過?!辈槐冲?/a>
2024-07-26 14:51 心智觀察所視頻 -
統(tǒng)一生態(tài):鴻蒙如何踩著諾基亞和三星的“尸體”前進(jìn)
2024-07-26 14:22 心智觀察所視頻 -
專稿|“藍(lán)屏網(wǎng)災(zāi)”暴露三大悖論,“純血鴻蒙”另辟蹊徑
2024-07-25 15:01 心智觀察所 -
打破認(rèn)知局限!我國(guó)科學(xué)家研發(fā)出這一新型材料
2024-07-25 09:39 科技前沿 -
歐盟的反補(bǔ)貼調(diào)查,到底圖中國(guó)啥?
2024-07-24 13:56 心智觀察所視頻 -
鴻蒙系統(tǒng)與安卓“割席”,未來勝算幾何?
2024-07-24 13:41 心智觀察所視頻 -
“慢就是快”的啟示:中國(guó)無人駕駛憑什么后來居上?
2024-07-24 09:49 心智觀察所 -
“7月24日至25日地球可能出現(xiàn)地磁暴過程”
2024-07-23 21:54 天文 -
我國(guó)科學(xué)家在月壤中首次發(fā)現(xiàn)分子水
2024-07-23 18:19 嫦娥奔月 -
新一代載人火箭三級(jí)液氫液氧發(fā)動(dòng)機(jī)長(zhǎng)程高模試驗(yàn)成功
2024-07-23 10:17 航空航天 -
國(guó)內(nèi)最大、世界第二!可用于航空航天等領(lǐng)域大型核心零部件的加工處理
2024-07-20 22:18 中國(guó)精造 -
意義重大!中國(guó)電力體系的壯闊藍(lán)圖,正在逐步清晰
2024-07-19 13:44 電力改革 -
“中國(guó)沒有,國(guó)際也沒有,但不意味中國(guó)科學(xué)家不能做出來”
2024-07-19 08:11 科技前沿 -
我國(guó)團(tuán)隊(duì)研發(fā)出太陽能動(dòng)力微型無人機(jī)
2024-07-19 07:22 科技前沿 -
重大突破!我國(guó)科學(xué)家發(fā)現(xiàn)新型高溫超導(dǎo)體
2024-07-18 20:45 科技前沿 -
我國(guó)科學(xué)家為“尼安德特人被現(xiàn)代人所同化”提供有力遺傳學(xué)證據(jù)
2024-07-18 15:11 科技前沿 -
Open RAN之死:華為中興不戰(zhàn)而勝
2024-07-18 10:27 華為 -
手機(jī)直連衛(wèi)星,中國(guó)星鏈何時(shí)能登場(chǎng)?
2024-07-18 08:33 -
“設(shè)計(jì)速度400公里每小時(shí),試驗(yàn)臺(tái)速度達(dá)600公里每小時(shí)”
2024-07-18 07:13 中國(guó)精造
相關(guān)推薦 -
“中國(guó)越抓緊,西方越焦慮” 評(píng)論 67比美國(guó)更快?“這將成為中國(guó)的‘斯普特尼克時(shí)刻’” 評(píng)論 255三季報(bào)全公布,10省份增速超上半年 評(píng)論 99“無論誰贏,歐洲已輸” 評(píng)論 141市場(chǎng)瘋狂下注特朗普,真金白銀比民調(diào)更準(zhǔn)確? 評(píng)論 119最新聞 Hot
-
比美國(guó)更快?“這將成為中國(guó)的‘斯普特尼克時(shí)刻’”
-
哈里斯:特朗普一句話冒犯了女性,冒犯了所有人
-
詹姆斯:支持哈里斯
-
秘密赴美訓(xùn)練卻被美軍曝光,臺(tái)當(dāng)局“頗感頭痛”
-
“中國(guó)越抓緊,西方越焦慮”
-
“中國(guó)工業(yè)制造規(guī)模是美國(guó)三倍!不拉上盟友,怎么競(jìng)爭(zhēng)?”
-
面對(duì)恐怖主義,美媒卻如此挑撥中國(guó)和“巴鐵”
-
德國(guó)外長(zhǎng)訪華遭冷落?真相是…
-
美媒發(fā)現(xiàn)中國(guó)雙航母“亮點(diǎn)”:殲15B和殲15D已服役
-
以色列拿到情報(bào):伊朗要?jiǎng)邮至?,或在美?guó)大選前
-
三季報(bào)全公布,10省份增速超上半年
-
“中國(guó)不再是從前那個(gè)學(xué)徒,完全能和西方正面交鋒”
-
美軍高官又“擔(dān)憂”上了:別老盯著俄羅斯,中國(guó)這速度才嚇人
-
被中方制裁后,這家美無人機(jī)廠商向美政府“喊疼”
-
“德國(guó)依賴中俄,就像被下藥了”
-
“‘歐盟CIA’即將成立”
-