-
百川智能發(fā)布金融大模型 聲稱準(zhǔn)確率超GPT-4o
-
楊付博杰17600980615
12月23日,百川智能發(fā)布了全新的全鏈路領(lǐng)域增強(qiáng)金融大模型Baichuan4-Finance。
百川智能在官網(wǎng)上表示,Baichuan4-Finance在多個(gè)金融評(píng)測(cè)體系中表現(xiàn)優(yōu)異,在中國(guó)人民大學(xué)財(cái)政金融學(xué)院發(fā)布的評(píng)測(cè)體系FLAME以及國(guó)內(nèi)開源金融評(píng)測(cè)基準(zhǔn)FinancelQ上,Baichuan4-Finance的表現(xiàn)均領(lǐng)先于GPT-4o。
在主要面向模型專業(yè)金融能力的評(píng)測(cè)FLAME-Cer中,Baichuan4-Finance在銀行、保險(xiǎn)、基金、證券等多個(gè)資格認(rèn)證領(lǐng)域的準(zhǔn)確率均突破了95%,整體準(zhǔn)確率達(dá)到93.62%,超出了GPT-4o近20%。
而在側(cè)重模型的場(chǎng)景應(yīng)用能力的FLAME-Sce 評(píng)測(cè)中,Baichuan4-Finance一級(jí)核心金融業(yè)務(wù)場(chǎng)景的整體可用率達(dá)84.15%,金融數(shù)據(jù)計(jì)算、金融知識(shí)理論等場(chǎng)景的可用率超過90%,同樣領(lǐng)先于GPT-4o。
此次百川智能發(fā)布的Baichuan4-Finance可以幫助金融從業(yè)者處理文檔審核、客戶咨詢、產(chǎn)品營(yíng)銷等大量日常工作,還能依托深厚的金融專業(yè)知識(shí)和法律法規(guī)理解能力,為機(jī)構(gòu)提供精準(zhǔn)的風(fēng)險(xiǎn)識(shí)別和合規(guī)保障。
可以看出,借助此次發(fā)布的金融大模型,百川智能有意在金融領(lǐng)域開發(fā)更多的To B端客戶。
大模型行業(yè)發(fā)力“應(yīng)用落地”
從今年下半年以來,市場(chǎng)上頻繁有傳言稱,被稱為“AI六小虎”的六家中國(guó)大模型獨(dú)角獸中,已經(jīng)有兩家企業(yè)停止預(yù)訓(xùn)練大模型,縮減了預(yù)訓(xùn)練算法團(tuán)隊(duì)人數(shù),并將業(yè)務(wù)重心轉(zhuǎn)向AI應(yīng)用。
“AI六小虎”是市場(chǎng)對(duì)智譜AI、零一萬物、MiniMax、百川智能、月之暗面、階躍星辰六家AI領(lǐng)域初創(chuàng)公司的稱呼,這些企業(yè)因其在大模型技術(shù)領(lǐng)域的創(chuàng)新和影響力而獲得此稱號(hào),并在融資、估值、中標(biāo)項(xiàng)目等方面表現(xiàn)出色。但隨著市場(chǎng)競(jìng)爭(zhēng)加劇和行業(yè)環(huán)境的變化,這些初創(chuàng)企業(yè)面臨著不同的挑戰(zhàn)和轉(zhuǎn)型壓力。
預(yù)訓(xùn)練是大模型的基礎(chǔ)階段,賦予模型海量而通用的知識(shí),是決定模型性能的關(guān)鍵步驟。在過去,許多大模型企業(yè)都選擇將預(yù)訓(xùn)練作為其核心競(jìng)爭(zhēng)力的體現(xiàn)。但這需要大量的數(shù)據(jù)和算力支持,每次迭代可能耗資數(shù)百萬至數(shù)億美元,對(duì)資源有限的初創(chuàng)公司來說是一個(gè)巨大的負(fù)擔(dān)。
以O(shè)pen AI為例,其GPT-3和GPT-4的訓(xùn)練成本分別高達(dá)1200萬美元和7800萬美元。而馬斯克曾估算,ChatGPT5.0訓(xùn)練可能需要3萬至5萬張H100,僅芯片成本就超過7億美元,約等于一家獨(dú)角獸企業(yè)的一大半市值。
在資金和算力緊缺的背景下,市場(chǎng)有傳言稱部分AI企業(yè)開始選擇放棄預(yù)訓(xùn)練,轉(zhuǎn)而專注于實(shí)際應(yīng)用場(chǎng)景的開發(fā),以減少高昂的算力和數(shù)據(jù)投入。
但對(duì)于具體是誰放棄了預(yù)訓(xùn)練,傳聞中的企業(yè)均對(duì)此進(jìn)行了否認(rèn)。
比如在今年10月,零一萬物的創(chuàng)始人李開復(fù)在朋友圈辟謠,稱零一萬物一直在做預(yù)訓(xùn)練,并即將推出新的預(yù)訓(xùn)練模型。百川智能也否認(rèn)了停止預(yù)訓(xùn)練的說法,稱公司預(yù)訓(xùn)練團(tuán)隊(duì)穩(wěn)定,預(yù)訓(xùn)練工作正在穩(wěn)步推進(jìn),并不存在放棄預(yù)訓(xùn)練一說。
而在本月初,智譜AI CEO張鵬也在一場(chǎng)活動(dòng)中明確表示“我們肯定一直在做預(yù)訓(xùn)練”,并稱公司每四到六個(gè)月就會(huì)迭代一版新模型。
盡管相關(guān)企業(yè)都對(duì)“放棄預(yù)訓(xùn)練”的傳言進(jìn)行了否認(rèn),不過在市場(chǎng)環(huán)境的壓力下,尋求更高效的商業(yè)模式和市場(chǎng)需求導(dǎo)向的發(fā)展路徑已經(jīng)成了許多AI領(lǐng)域初創(chuàng)公司的重要任務(wù)。
就在今年的10月份,零一萬物推出了針對(duì)零售和電商場(chǎng)景的ToB產(chǎn)品,發(fā)布了面向電商直播、辦公會(huì)議等場(chǎng)景的數(shù)字人解決方案。而百川智能則在醫(yī)療領(lǐng)域取得了進(jìn)展,推出了AI健康顧問,并與國(guó)家兒童醫(yī)學(xué)中心和北京兒童醫(yī)院,共同研發(fā)出了兒童健康大模型。而百川智能推出的通用醫(yī)療增強(qiáng)大模型,則在美國(guó)執(zhí)業(yè)醫(yī)師資格考試(USMLE)中的準(zhǔn)確率超過94%,并在由醫(yī)生(如協(xié)和、北醫(yī)等頭部三甲高年資主任、主治醫(yī)師)和心理學(xué)專家作為評(píng)測(cè)主體的真實(shí)人工評(píng)測(cè)中表現(xiàn)超越了GPT-4。
隨著市場(chǎng)的成熟,大模型企業(yè)開始更加注重產(chǎn)品的核心競(jìng)爭(zhēng)力和實(shí)際場(chǎng)景的用戶體驗(yàn)。
2023年6月開始的“百模大戰(zhàn)”已經(jīng)逐漸降溫,大模型行業(yè)的市場(chǎng)競(jìng)爭(zhēng)已經(jīng)從燒錢階段轉(zhuǎn)向了更加理性和務(wù)實(shí)的階段。為應(yīng)對(duì)市場(chǎng)壓力和生存挑戰(zhàn),初創(chuàng)企業(yè)們正在努力通過應(yīng)用開發(fā)實(shí)現(xiàn)轉(zhuǎn)型,誰能更精準(zhǔn)地將AI技術(shù)融入實(shí)際應(yīng)用場(chǎng)景,并創(chuàng)造出切實(shí)的價(jià)值,將成為決定其在市場(chǎng)中生存與發(fā)展的關(guān)鍵。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 大模型- 責(zé)任編輯: 楊付博杰 
-
昇思開源社區(qū)新星:共同成長(zhǎng),助中國(guó)AI框架崛起
2024-12-23 17:55 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
首個(gè)國(guó)產(chǎn)靶向藥美國(guó)獲批,意義多大?
2024-12-23 14:05 -
中車斬獲迪拜56億美元大單
2024-12-23 11:35 -
“人在家中坐,賬戶天上來”,多家銀行回應(yīng)
2024-12-23 11:33 養(yǎng)老與社保 -
規(guī)模堪比美國(guó)總部!英偉達(dá)被曝?cái)M在臺(tái)灣建立新總部
2024-12-23 11:00 -
“蝦滑疑吃出蛆”?海底撈回應(yīng)
2024-12-21 17:21 食品安全 -
-
越南關(guān)停2G,推動(dòng)4G手機(jī)出貨量驟增
2024-12-20 22:17 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
中國(guó)“光伏OPEC”發(fā)文嚴(yán)厲質(zhì)問央企,怎么回事?
2024-12-20 18:06 -
微信發(fā)力社交電商?小店上線“送禮物”功能
2024-12-20 18:00 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
華為超充機(jī)器人亮相:明年上半年量產(chǎn)
2024-12-20 16:33 華為 -
美企侵權(quán),華為在歐洲勝訴
2024-12-20 15:48 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
小紅書大面積封號(hào)登頂熱搜,有用戶稱參加個(gè)活動(dòng)就被封
2024-12-20 14:30 大公司 -
他倆一個(gè)自殺、一個(gè)被捕?蘋果AI推送假新聞鬧大了
2024-12-20 12:38 網(wǎng)絡(luò)安全 -
中國(guó)1年期國(guó)債收益率跌至1%
2024-12-20 10:39 金融觀察 -
“年底前央行降準(zhǔn)幅度或達(dá)0.5%”
2024-12-20 10:06 金融觀察 -
英偉達(dá)最大買家曝光,一年囤了近50萬顆GPU
2024-12-19 20:18 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
放下身段的日本車企,學(xué)起中國(guó)來能有多徹底?
2024-12-19 16:30 觀察者頭條 -
蘋果被曝與騰訊、字節(jié)接洽大模型合作,此前傳與百度合作不順
2024-12-19 14:20 大公司
相關(guān)推薦 -
-
東部戰(zhàn)區(qū)位臺(tái)島周邊開展聯(lián)合演訓(xùn) 評(píng)論 147特朗普威脅俄羅斯有沒有用?“到頭來還要看中印” 評(píng)論 51他還沒去倒是想挺美:火星將是美國(guó)的一部分 評(píng)論 180“半個(gè)房本不夠買輛車,特朗普狠傷自己基本盤” 評(píng)論 173“和中美搶占份額”,歐洲“光譜”首戰(zhàn)失敗 評(píng)論 221最新聞 Hot
-
“再不打錢,歐洲在這個(gè)領(lǐng)域也會(huì)輸給中國(guó)”
-
特朗普發(fā)聲:勒龐這事很大
-
“波音飛船性能出色,下次還會(huì)乘坐”
-
哈佛,也遭“清算”
-
東部戰(zhàn)區(qū)位臺(tái)島周邊開展聯(lián)合演訓(xùn)
-
加拿大人也不買了
-
“DOGE讓我付出了很大的代價(jià),但...”
-
特朗普威脅俄羅斯有沒有用?“到頭來還要看中印”
-
“烏克蘭計(jì)劃夏天大選,前提是...”
-
勒龐被定罪,不能競(jìng)選法國(guó)總統(tǒng)了
-
他還沒去倒是想挺美:火星將是美國(guó)的一部分
-
日本再發(fā)警告:若發(fā)生,或致近30萬人遇難
-
“半個(gè)房本不夠買輛車,特朗普狠傷自己基本盤”
-
美科技巨頭重倉(cāng)這一領(lǐng)域,“但中國(guó)已經(jīng)領(lǐng)先”
-
日本:最后的堡壘,也開始塌了
-
“和中美搶占份額”,歐洲“光譜”首戰(zhàn)失敗
-