-
OpenAI新推理模型價(jià)格驟降,總體性價(jià)比未能超越DeepSeek R1
最后更新: 2025-02-06 18:10:09當(dāng)?shù)貢r(shí)間1月31日,美國OpenAI公司正式上線推理模型o3-mini,并首次向免費(fèi)用戶開放推理模型,一同亮相的還有“滿血版”的o3模型。
來源:OpenAI
OpenAI表示,o3具備更先進(jìn)、近似人類的推理能力,在解決編程、數(shù)學(xué)、科學(xué)等理工科問題方面均超越現(xiàn)役的o1模型。該公司曾表示,o3-mini會(huì)在1月底先上架,o3則“會(huì)在不久之后推出”。
根據(jù)介紹,o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”的選項(xiàng)——分為低、中、高三個(gè)級(jí)別。這種靈活性使得o3-mini可以在面對(duì)難題時(shí)“更努力思考”,而需要效率時(shí)優(yōu)先考慮回應(yīng)速度。開發(fā)者可根據(jù)需求選擇推理強(qiáng)度,平衡思考深度和響應(yīng)速度,但不支持視覺任務(wù),視覺推理仍需使用o1。
在新聞稿中,OpenAI披露,在2024年美國數(shù)學(xué)邀請(qǐng)賽(AIME 2024)的測試中,低推理努力的o3-mini準(zhǔn)確率(60%)與o1-mini差不多,但速率更快;而在中等努力下,o3-mini準(zhǔn)確率能夠提升到79.6%,與o1模型相當(dāng)。在最高努力水平時(shí),o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。
在博士級(jí)科學(xué)問題(GPQA Diamond)方面,三種努力程度模型的準(zhǔn)確率分別為70.6%、76.8%和79.7%,該測試主要用于衡量模型在博士級(jí)別物理、生物和化學(xué)問題上的表現(xiàn)。
有外媒還將o3-mini和DeepSeek的R1模型進(jìn)行了對(duì)比。
在AIME 2024測試中,o3-mini僅在高推理強(qiáng)度下表現(xiàn)優(yōu)于R1(79.8%)。在以編程為重點(diǎn)的SWE-bench Verified基準(zhǔn)測試中,o3-mini同樣僅在高推理強(qiáng)度下以微弱優(yōu)勢(0.1 分)領(lǐng)先R1。在低推理強(qiáng)度下,o3-mini在GPQA Diamond基準(zhǔn)測試中落后于R1(71.5%)。
OpenAI宣布,從當(dāng)天開始,免費(fèi)ChatGPT用戶也能通過在編輯器中選擇“推理”來嘗試o3-mini模型,這也是公司的推理模型首次向免費(fèi)用戶開放。
對(duì)于付費(fèi)用戶,o3-mini將在模型選擇器中替代o1-mini。作為升級(jí)的一部分,每月花費(fèi)20美元左右的ChatGPT Plus和Team用戶,速率限制也從o1-mini的每天50條,提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶,能無限制地訪問o3-mini。
近期,爆火的DeepSeek-R1模型對(duì)OpenAI構(gòu)成了競爭壓力,尤其在成本方面呈現(xiàn)出顯著差異。
OpenAI 的推理模型o1系列相對(duì)成本較高,o1模型的API定價(jià)為每百萬輸入tokens 15美元,每百萬輸出tokens 60美元,而DeepSeek R1的API定價(jià)為每百萬輸入tokens 0.14美元(緩存命中)/0.55美元(緩存未命中),每百萬輸出tokens 2.19美元。
這次發(fā)布中,OpenAI強(qiáng)調(diào)了成本問題。與OpenAI的o1-mini相比,o3-mini的價(jià)格降低了63%。o3-mini定價(jià)為每百萬輸入tokens 1.10美元,每百萬輸出tokens 4.40美元,。不過,相比DeepSeek-R1,o3-mini的價(jià)格依然高出了不少。
o3-mini與DeepSeek-R1價(jià)格對(duì)比
安全方面,OpenAI表示,在訓(xùn)練o3-mini以實(shí)現(xiàn)安全響應(yīng)的過程中,采用了一種關(guān)鍵技術(shù)--“深思熟慮的對(duì)齊(deliberative alignment)”。
通過這種方法,OpenAI訓(xùn)練模型在回答用戶提示之前,先對(duì)人類編寫的安全規(guī)范進(jìn)行推理??梢岳斫鉃?,OpenAI希望確保o3-mini生成的內(nèi)容更加安全、符合道德,并降低了模型生成不良或有害響應(yīng)的風(fēng)險(xiǎn)。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 林鈴錦 
-
高通CEO:DeepSeek R1對(duì)高通有利
2025-02-06 17:57 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
華為小藝、聯(lián)想小天等接入DeepSeek
2025-02-06 14:14 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
變現(xiàn)困難還面臨跨賽道競爭,All in AI能幫Keep減虧嗎?
2025-02-06 13:23 大公司 -
全球頂尖AI科學(xué)家、前Salesforce副總裁加入阿里
2025-02-06 11:59 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
-
螞蟻集團(tuán)官宣新任CFO
2025-02-06 11:20 觀網(wǎng)財(cái)經(jīng)-金融 -
蘋果跌了,這一消息是導(dǎo)火索?
2025-02-06 06:39 -
價(jià)格崩塌后,默沙東對(duì)華停供四價(jià)HPV疫苗
2025-02-05 19:48 產(chǎn)業(yè)萬象 -
-
春節(jié)跨境游訂單增三成,日本成最熱目的地
2025-02-05 16:19 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
“酒系銀行”宜賓銀行3.5%股權(quán)流拍,20倍市盈率嚇退買家
2025-02-05 16:09 觀網(wǎng)財(cái)經(jīng)-金融 -
-
-
美國知名測評(píng):繼DeepSeek后,通義千問也追上OpenAI
2025-02-05 15:18 人工智能 -
美國郵政暫停接收來自中國內(nèi)地和香港的入境包裹
2025-02-05 14:44 觀網(wǎng)財(cái)經(jīng)-海外 -
華為董事長:去年?duì)I收超8600億
2025-02-05 14:03 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
中國七大云廠商集中上線DeepSeek
2025-02-05 11:28 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
A股deepseek概念掀漲停潮,機(jī)器人板塊走強(qiáng)
2025-02-05 10:56 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
“硅谷有種常見病,認(rèn)為圈外所有創(chuàng)新都是作弊得來的”
2025-02-02 21:01 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
華為和DeepSeek聯(lián)手,硅基流動(dòng)首發(fā)被擠爆
2025-02-01 18:23 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
特魯多迎來“最后一天”,特朗普成了“意外救星” 評(píng)論 15“特朗普政府已通知盟友,將停止參加歐洲未來軍演” 評(píng)論 68默茨急劇掉頭,“這是典型的‘尼克松訪華時(shí)刻’” 評(píng)論 168對(duì)歐洲“感到憤怒”,“特朗普想把駐德美軍全撤走” 評(píng)論 184特朗普威脅“不談就打”,伊朗最高領(lǐng)袖表態(tài) 評(píng)論 325最新聞 Hot
-
歐洲多國驚覺:被美國掌握一個(gè)“致命開關(guān)”
-
對(duì)歐洲“感到憤怒”,“特朗普想把駐德美軍全撤走”
-
紐約發(fā)生多起山火,紐約州進(jìn)入緊急狀態(tài)
-
特朗普威脅“不談就打”,伊朗最高領(lǐng)袖表態(tài)
-
“烏克蘭半瞎了,歐洲急了”
-
尹錫悅獲釋第二天,首爾10萬民眾集會(huì)游行
-
美媒哀嘆:所謂的“西方”,已蕩然無存
-
“1500億歐元貸款計(jì)劃,法德又吵起來了”
-
“看看中國高鐵再看美鐵,尬死了”
-
特朗普怒砍哥大4億美元:打擊“反猶”不給力啊
-
“特朗普想重新劃定美加邊界”
-
“魯比奧與馬斯克干架了”,特朗普忙滅火
-
“因?yàn)槲沂敲绹耍谂_(tái)積電被罵又懶又蠢”,下月開庭
-
“普京愿意,但有條件”
-
“最大受害者是波音,中國要么用國產(chǎn),要么買空客”
-
特朗普:和烏克蘭打交道比和俄羅斯更難
-