激情久久久久久免费观,欧美一级日韩一级亚洲一级

APP下載

掃一掃

下載觀察者APP

OpenAI新推理模型價(jià)格驟降，總體性價(jià)比未能超越DeepSeek R1
- 林鈴錦
分享到：

2025-02-02 16:32:01 字號(hào)：A- A A+ 來源：觀察者網(wǎng)

最后更新: 2025-02-06 18:10:09

當(dāng)?shù)貢r(shí)間1月31日，美國OpenAI公司正式上線推理模型o3-mini，并首次向免費(fèi)用戶開放推理模型，一同亮相的還有“滿血版”的o3模型。

來源：OpenAI

OpenAI表示，o3具備更先進(jìn)、近似人類的推理能力，在解決編程、數(shù)學(xué)、科學(xué)等理工科問題方面均超越現(xiàn)役的o1模型。該公司曾表示，o3-mini會(huì)在1月底先上架，o3則“會(huì)在不久之后推出”。

根據(jù)介紹，o3-mini支持開發(fā)者調(diào)整“AI推理努力程度”的選項(xiàng)——分為低、中、高三個(gè)級(jí)別。這種靈活性使得o3-mini可以在面對(duì)難題時(shí)“更努力思考”，而需要效率時(shí)優(yōu)先考慮回應(yīng)速度。開發(fā)者可根據(jù)需求選擇推理強(qiáng)度，平衡思考深度和響應(yīng)速度，但不支持視覺任務(wù)，視覺推理仍需使用o1。

在新聞稿中，OpenAI披露，在2024年美國數(shù)學(xué)邀請(qǐng)賽（AIME 2024）的測試中，低推理努力的o3-mini準(zhǔn)確率（60%）與o1-mini差不多，但速率更快；而在中等努力下，o3-mini準(zhǔn)確率能夠提升到79.6%，與o1模型相當(dāng)。在最高努力水平時(shí)，o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。

在博士級(jí)科學(xué)問題（GPQA Diamond）方面，三種努力程度模型的準(zhǔn)確率分別為70.6%、76.8%和79.7%，該測試主要用于衡量模型在博士級(jí)別物理、生物和化學(xué)問題上的表現(xiàn)。

有外媒還將o3-mini和DeepSeek的R1模型進(jìn)行了對(duì)比。

在AIME 2024測試中，o3-mini僅在高推理強(qiáng)度下表現(xiàn)優(yōu)于R1（79.8%）。在以編程為重點(diǎn)的SWE-bench Verified基準(zhǔn)測試中，o3-mini同樣僅在高推理強(qiáng)度下以微弱優(yōu)勢（0.1 分）領(lǐng)先R1。在低推理強(qiáng)度下，o3-mini在GPQA Diamond基準(zhǔn)測試中落后于R1（71.5%）。

OpenAI宣布，從當(dāng)天開始，免費(fèi)ChatGPT用戶也能通過在編輯器中選擇“推理”來嘗試o3-mini模型，這也是公司的推理模型首次向免費(fèi)用戶開放。

對(duì)于付費(fèi)用戶，o3-mini將在模型選擇器中替代o1-mini。作為升級(jí)的一部分，每月花費(fèi)20美元左右的ChatGPT Plus和Team用戶，速率限制也從o1-mini的每天50條，提升到o3-mini的150條。每月支付200美元的ChatGPT Pro用戶，能無限制地訪問o3-mini。

近期，爆火的DeepSeek-R1模型對(duì)OpenAI構(gòu)成了競爭壓力，尤其在成本方面呈現(xiàn)出顯著差異。

OpenAI 的推理模型o1系列相對(duì)成本較高，o1模型的API定價(jià)為每百萬輸入tokens 15美元，每百萬輸出tokens 60美元，而DeepSeek R1的API定價(jià)為每百萬輸入tokens 0.14美元（緩存命中）/0.55美元（緩存未命中），每百萬輸出tokens 2.19美元。

這次發(fā)布中，OpenAI強(qiáng)調(diào)了成本問題。與OpenAI的o1-mini相比，o3-mini的價(jià)格降低了63%。o3-mini定價(jià)為每百萬輸入tokens 1.10美元，每百萬輸出tokens 4.40美元,。不過，相比DeepSeek-R1，o3-mini的價(jià)格依然高出了不少。

o3-mini與DeepSeek-R1價(jià)格對(duì)比

安全方面，OpenAI表示，在訓(xùn)練o3-mini以實(shí)現(xiàn)安全響應(yīng)的過程中，采用了一種關(guān)鍵技術(shù)--“深思熟慮的對(duì)齊（deliberative alignment）”。

通過這種方法，OpenAI訓(xùn)練模型在回答用戶提示之前，先對(duì)人類編寫的安全規(guī)范進(jìn)行推理?？梢岳斫鉃?，OpenAI希望確保o3-mini生成的內(nèi)容更加安全、符合道德，并降低了模型生成不良或有害響應(yīng)的風(fēng)險(xiǎn)。

本文系觀察者網(wǎng)獨(dú)家稿件，未經(jīng)授權(quán)，不得轉(zhuǎn)載。
|

舉報(bào)
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實(shí)信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報(bào)制度規(guī)范
確定取消
標(biāo)簽
- 責(zé)任編輯: 林鈴錦
- 高通CEO：DeepSeek R1對(duì)高通有利
  
  2025-02-06 17:57 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- 華為小藝、聯(lián)想小天等接入DeepSeek
  
  2025-02-06 14:14 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- 變現(xiàn)困難還面臨跨賽道競爭，All in AI能幫Keep減虧嗎？
  
  2025-02-06 13:23 大公司
- 全球頂尖AI科學(xué)家、前Salesforce副總裁加入阿里
  
  2025-02-06 11:59 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng)
- Keep早盤漲超22%，創(chuàng)始人發(fā)全員信表態(tài)將All in AI
  
  2025-02-06 11:38 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng)
- 螞蟻集團(tuán)官宣新任CFO
  
  2025-02-06 11:20 觀網(wǎng)財(cái)經(jīng)-金融
- 蘋果跌了，這一消息是導(dǎo)火索？
  
  2025-02-06 06:39
- 價(jià)格崩塌后，默沙東對(duì)華停供四價(jià)HPV疫苗
  
  2025-02-05 19:48 產(chǎn)業(yè)萬象
- 英偉達(dá)出貨預(yù)期遭大幅下調(diào)，國產(chǎn)算力集體支持DeepSeek
  
  2025-02-05 17:16 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- 春節(jié)跨境游訂單增三成，日本成最熱目的地
  
  2025-02-05 16:19 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng)
- “酒系銀行”宜賓銀行3.5%股權(quán)流拍，20倍市盈率嚇退買家
  
  2025-02-05 16:09 觀網(wǎng)財(cái)經(jīng)-金融
- 傳美國考慮將Shein和Temu列入“強(qiáng)迫勞動(dòng)”名單，兩企業(yè)回應(yīng)
  
  2025-02-05 15:39 觀網(wǎng)財(cái)經(jīng)-海外
- 春節(jié)消費(fèi)亮點(diǎn)出爐：非遺文化熱度飆升，智能產(chǎn)品引領(lǐng)換新潮
  
  2025-02-05 15:29 觀網(wǎng)財(cái)經(jīng)-消費(fèi)
- 美國知名測評(píng)：繼DeepSeek后，通義千問也追上OpenAI
  
  2025-02-05 15:18 人工智能
- 美國郵政暫停接收來自中國內(nèi)地和香港的入境包裹
  
  2025-02-05 14:44 觀網(wǎng)財(cái)經(jīng)-海外
- 華為董事長：去年?duì)I收超8600億
  
  2025-02-05 14:03 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- 中國七大云廠商集中上線DeepSeek
  
  2025-02-05 11:28 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- A股deepseek概念掀漲停潮，機(jī)器人板塊走強(qiáng)
  
  2025-02-05 10:56 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- “硅谷有種常見病，認(rèn)為圈外所有創(chuàng)新都是作弊得來的”
  
  2025-02-02 21:01 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
- 華為和DeepSeek聯(lián)手，硅基流動(dòng)首發(fā)被擠爆
  
  2025-02-01 18:23 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
搜索

   觀察者頭條查看全部

特魯多迎來“最后一天”，特朗普成了“意外救星” 評(píng)論 15

“特朗普政府已通知盟友，將停止參加歐洲未來軍演” 評(píng)論 68

默茨急劇掉頭，“這是典型的‘尼克松訪華時(shí)刻’” 評(píng)論 168

對(duì)歐洲“感到憤怒”，“特朗普想把駐德美軍全撤走” 評(píng)論 184

特朗普威脅“不談就打”，伊朗最高領(lǐng)袖表態(tài) 評(píng)論 325

   風(fēng)聞 · 24小時(shí)最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

OpenAI新推理模型價(jià)格驟降，總體性價(jià)比未能超越DeepSeek R1

高通CEO：DeepSeek R1對(duì)高通有利

華為小藝、聯(lián)想小天等接入DeepSeek

變現(xiàn)困難還面臨跨賽道競爭，All in AI能幫Keep減虧嗎？

全球頂尖AI科學(xué)家、前Salesforce副總裁加入阿里

Keep早盤漲超22%，創(chuàng)始人發(fā)全員信表態(tài)將All in AI

螞蟻集團(tuán)官宣新任CFO

蘋果跌了，這一消息是導(dǎo)火索？

價(jià)格崩塌后，默沙東對(duì)華停供四價(jià)HPV疫苗

英偉達(dá)出貨預(yù)期遭大幅下調(diào)，國產(chǎn)算力集體支持DeepSeek

春節(jié)跨境游訂單增三成，日本成最熱目的地

“酒系銀行”宜賓銀行3.5%股權(quán)流拍，20倍市盈率嚇退買家

傳美國考慮將Shein和Temu列入“強(qiáng)迫勞動(dòng)”名單，兩企業(yè)回應(yīng)

春節(jié)消費(fèi)亮點(diǎn)出爐：非遺文化熱度飆升，智能產(chǎn)品引領(lǐng)換新潮

美國知名測評(píng)：繼DeepSeek后，通義千問也追上OpenAI

美國郵政暫停接收來自中國內(nèi)地和香港的入境包裹

華為董事長：去年?duì)I收超8600億

中國七大云廠商集中上線DeepSeek

A股deepseek概念掀漲停潮，機(jī)器人板塊走強(qiáng)

“硅谷有種常見病，認(rèn)為圈外所有創(chuàng)新都是作弊得來的”

華為和DeepSeek聯(lián)手，硅基流動(dòng)首發(fā)被擠爆

歐洲多國驚覺：被美國掌握一個(gè)“致命開關(guān)”

對(duì)歐洲“感到憤怒”，“特朗普想把駐德美軍全撤走”

紐約發(fā)生多起山火，紐約州進(jìn)入緊急狀態(tài)

特朗普威脅“不談就打”，伊朗最高領(lǐng)袖表態(tài)

“烏克蘭半瞎了，歐洲急了”

尹錫悅獲釋第二天，首爾10萬民眾集會(huì)游行

美媒哀嘆：所謂的“西方”，已蕩然無存

“1500億歐元貸款計(jì)劃，法德又吵起來了”

“看看中國高鐵再看美鐵，尬死了”

特朗普怒砍哥大4億美元：打擊“反猶”不給力啊

“特朗普想重新劃定美加邊界”

“魯比奧與馬斯克干架了”，特朗普忙滅火

“因?yàn)槲沂敲绹耍谂_(tái)積電被罵又懶又蠢”，下月開庭

“普京愿意，但有條件”

“最大受害者是波音，中國要么用國產(chǎn)，要么買空客”

特朗普：和烏克蘭打交道比和俄羅斯更難