-
OpenAI推出GPT-4o mini,號稱“最具成本效益的小模型”
最后更新: 2024-07-19 11:44:46美東時間7月18日,OpenAI推出GPT-4o mini,并聲稱這是“最具成本效益的小型模型”。GPT-4o mini預(yù)計將通過讓智能變得更加實惠,顯著擴大使用AI構(gòu)建的應(yīng)用程序范圍。
據(jù)OpenAI發(fā)布的消息,GPT-4o mini在MMLU(大規(guī)模多任務(wù)語言理解,衡量模型廣泛的世界知識和解決問題的能力)上的得分為82%,比另外兩款低成本競品更高——Google的Gemini Flash得分為77.9%,Anthropic的Claude Haiku得分為73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面優(yōu)于GPT-4.
GPT-4o mini已經(jīng)在幾個關(guān)鍵基準上進行了評估,涉及文本和視覺的推理任務(wù)、數(shù)學(xué)推理和編碼任務(wù)、多模態(tài)推理,結(jié)果均優(yōu)于其他小型模型。
各種評估基準下的模型評估分數(shù)OpenAI官方網(wǎng)站
GPT-4o mini還在API中支持文本和視覺功能,未來還將支持文本、圖像、視頻和音頻的輸入和輸出,并且擁有截至2023年10月的知識。得益于與GPT-4o共享的改進的tokenizer(編譯器),GPT-4o mini處理非英語文本方面也更具成本效益。
GPT-4o mini成本更低、延遲更低,能夠完成更多的任務(wù),例如調(diào)用多個API(應(yīng)用程序編程接口)、傳遞和記錄大量完整的代碼庫或?qū)υ捰涗洝⒏焖?、實時地與使用者聊天等。
作為模型開發(fā)過程的一部分,OpenAI 已經(jīng)與一些值得信賴的合作伙伴合作,以更好地了解GPT-4o mini的使用場景和局限性。目前已與Ramp和超人等公司進行了合作,反饋發(fā)現(xiàn)在執(zhí)行從收據(jù)文件中提取結(jié)構(gòu)化數(shù)據(jù)或在提供線程歷史記錄時生成高質(zhì)量電子郵件響應(yīng)等任務(wù)時,GPT-4o mini的表現(xiàn)明顯優(yōu)于GPT-3.5 Turbo。
考慮到價格因素,輕量化且廉價的“小而精”AI模型可能更受企業(yè)歡迎,小模型的相關(guān)開發(fā)競爭激烈。談及為何沒有更早地推出“小而精”的模型時,OpenAI的API產(chǎn)品負責(zé)人Olivier Godement說,“我們的使命是使用最前沿技術(shù),構(gòu)建最強大、最有用的應(yīng)用程序,我們當(dāng)然希望繼續(xù)做前沿模型,推動技術(shù)進步……但我們也希望擁有最好的小模型,我認為它會非常受歡迎。”
OpenAI稱,開發(fā)過程中的每一步都考慮了安全性。開發(fā)時會過濾掉仇恨言論、色情信息、個人隱私信息等不宜模型學(xué)習(xí)和輸出的內(nèi)容,并采用自動和人工(超過70位來自社會心理學(xué)和錯誤信息等領(lǐng)域的外部專家)對模型進行了評估,以識別潛在風(fēng)險。GPT-4o mini是第一個應(yīng)用指令層次結(jié)構(gòu)的模型,有助于提高模型抵抗越獄、即時注入和系統(tǒng)即時提取的能力,這使得模型的響應(yīng)更加可靠,并有助于使其在大規(guī)模應(yīng)用中更安全地使用。
自2022年推出功能較弱的模型text-davinci-003以來,GPT-4o mini的每token成本已下降99%。GPT-4o mini定價比之前的Frontier型號便宜一個數(shù)量級,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免費版、Plus版和團隊版用戶已經(jīng)能夠使用GPT-4o mini替代GPT-3.5,企業(yè)用戶也將從下周開始使用。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 李亞麗 
-
被歐盟法院裁定為“守門人”,字節(jié)跳動:失望
2024-07-18 17:54 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
去年虧損近40億元,東風(fēng)汽車集團仍難回歸A股
2024-07-18 17:22 觀出行 產(chǎn)業(yè)新聞 -
開售3個月,華為Pura70官宣降價
2024-07-18 13:32 觀網(wǎng)財經(jīng)-科創(chuàng) -
20多座高鐵站“閑置”,還有救嗎?
2024-07-18 13:28 高鐵世紀 -
“實現(xiàn)中國式現(xiàn)代化,需要三大區(qū)域共挑大梁”
2024-07-18 11:36 中國經(jīng)濟 -
陳文玲:開放就是最大的改革
2024-07-18 10:33 2024中國經(jīng)濟季度觀察 -
陳文玲:這是中國在大國競爭博弈中的底氣
2024-07-18 10:33 2024中國經(jīng)濟季度觀察 -
香港消委會就農(nóng)夫山泉事件致歉
2024-07-18 09:22 觀網(wǎng)財經(jīng)-消費 -
飲用水跌回“1元時代”
2024-07-18 07:34 觀網(wǎng)財經(jīng)-消費 -
31省份上半年人均可支配收入:10省份超兩萬元
2024-07-17 20:20 觀網(wǎng)財經(jīng)-宏觀 -
管濤:人民幣國際化加速的原因是……?
2024-07-17 18:14 中國經(jīng)濟 -
普華永道將裁掉一半在中國的金融審計員工?回應(yīng)稱,調(diào)整是艱難的決定
2024-07-17 17:29 金融觀察 -
中國大陸發(fā)力成熟芯片,連續(xù)占據(jù)光刻機巨頭半數(shù)營收
2024-07-17 15:41 觀網(wǎng)財經(jīng)-科創(chuàng) -
中國經(jīng)濟發(fā)展有獨門法寶
2024-07-17 15:34 2024中國經(jīng)濟季度觀察 -
楊建文:產(chǎn)業(yè)層面要能夠推出“新新三樣”
2024-07-17 15:22 2024中國經(jīng)濟季度觀察 -
財政部擬再發(fā)總額550億元超長期特別國債
2024-07-17 15:20 金融觀察 -
“如果讓購房者感受到,之后再也沒有這么低的按揭利率…”
2024-07-17 13:50 觀網(wǎng)財經(jīng)-房產(chǎn) -
連平:房地產(chǎn)企穩(wěn)將是重要的積極信號
2024-07-17 13:40 2024中國經(jīng)濟季度觀察 -
特朗普稱臺灣應(yīng)交“保護費”,臺積電應(yīng)聲大跌超2%
2024-07-17 11:47 特朗普 -
一夜之間,黃金價格再創(chuàng)新高!有人一次下單近20萬元金條
2024-07-17 09:57 黃金游戲
相關(guān)推薦 -
“歐盟將派特使赴華探索關(guān)稅替代方案” 評論 290美陸軍為與中國開戰(zhàn)做準備?“都是生意” 評論 319最新聞 Hot
-
無論誰勝選,華裔科學(xué)家們都擔(dān)心再遭迫害
-
187:2!只有美以反對,中方發(fā)聲
-
“這時候,歐盟要下手了”
-
論整活還得是他,直接開了輛垃圾車…
-
馬上走了,他還在念叨中國
-
“超10萬名烏克蘭士兵當(dāng)逃兵”
-
“特朗普明說了:明年1月我重返白宮前,你必須…”
-
他向白宮開炮:美媒這樣泄密,伙伴間還有機密可言嗎?
-
“歐盟將派特使赴華探索關(guān)稅替代方案”
-
“反對黨拒絕加入執(zhí)政聯(lián)盟,石破茂或?qū)で蠼M建少數(shù)黨政府”
-
“德國經(jīng)濟深陷停滯,執(zhí)政聯(lián)盟卻還在內(nèi)訌”
-
“我們那么給力,烏克蘭收到武器卻翻臉”
-
美陸軍為與中國開戰(zhàn)做準備?“都是生意”
-
《反間諜法》通過后首位被捕的韓國人,韓媒披露身份
-
澳大利亞公布這一“藍圖”,聲稱為了嚇唬中國…
-
“美國圍堵6年,中國拿下5個關(guān)鍵技術(shù)領(lǐng)先”
-