大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

OpenAI產品線又有新動作了:o3價格打骨折,開源模型再延期

0
分享至

OpenAI 前腳剛大幅下調了 o3 模型的價格,后腳就推出了其新的最強模型 o3-Pro。

當地時間 6 月 10 日,OpenAI 正式下調了其 o3 模型的 API 價格。調整后,每百萬輸入 token 的價格從 10 美元降至 2 美元,輸出 token 的價格從 40 美元降至 8 美元。這次 80% 的降價,讓 o3 的成本與 GPT-4.1 模型保持一致。


圖丨o3 的價格調整(來源:OpenAI)

在宣布 o3 降價的同時,OpenAI 推出了 o3-pro 模型。該模型在 API 和 ChatGPT Pro/Team 用戶的選擇列表中取代了此前的 o1-pro。企業版和教育版用戶則會在一周后獲得訪問權限(Plus 用戶暫時無緣使用)。與 o3 的降價策略形成鮮明對比,o3-pro 的定價顯著提高:每百萬輸入 token 為 20 美元,輸出 token 為 80 美元,是調整后 o3 價格的十倍。

根據 OpenAI 官方發布的評估數據,o3-pro 在多個維度的測試中均優于其前身。

在與人類測試者的對比評估中,o3-pro 在所有查詢類別中的綜合勝率達到了 64%。在具體的專業領域,其優勢更為明顯:在科學分析和數據分析任務中,勝率分別達到 64.9% 和 64.3%;在個人寫作和計算機編程方面,勝率則為 66.7% 和 62.7%。


圖丨o3-Pro 的評估表現(來源:OpenAI)

在“4/4 可靠性”基準測試中,o3-pro 同樣表現出突出。這項測試要求模型在四次獨立嘗試中全部正確回答同一個問題才算通過。在競爭性數學(AIME 2024)和博士級科學問題(GPQA Diamond)這類高難度測試中,o3-pro 的可靠性得分分別達到了 90% 和 76%,均高于 o3 和 o1-pro。在編程能力(Codeforces)的評估中,o3-pro 的 Elo 等級分也顯著高于前代模型,達到了 2301 分。這些硬性指標從數據層面證實了 o3-pro 在處理復雜、精確任務時的可靠性優勢。

許多用戶的實測也印證了其強大能力。

不過,能力的提升也帶來了時間和成本的增加。這一點在早期用戶的反饋中得到了證實。部分開發者反映該模型響應緩慢且費用高昂。

例如,Hyerbolic Labs 的 CTO Yuchen Jin 提到,一句簡單的“Hi,I'm Sam Altman”就足足讓模型思考了將近四分鐘,甚至最長能達到 13 分鐘。


圖丨相關推文(來源:X)

OpenAI 官方對此進行了解釋,稱 o3-pro 的設計目標是“進行更長時間的思考,并提供最可靠的響應”。公司表示,o3-pro 能夠訪問更多的軟件工具,包括網頁搜索、文件分析、視覺輸入推理和 Python 代碼執行,這些能力的調用使其響應時間比普通模型更長。OpenAI 的官方建議是,將 o3-pro 用于“可靠性比速度更重要的挑戰性問題”,認為在這些場景下,額外的等待時間是值得的。

對于能夠適應其特性的用戶,o3-pro 就表現出了不俗的能力。

Raindrop 公司的聯合創始人 Ben Hylak 在一篇詳細的評測中分享了他的使用經驗。他認為,使用 o3-pro 的正確方式是“像使用報告生成器一樣”,即一次性提供大量、詳盡的上下文信息,而不是進行來回的對話式交流。他將這一核心思想概括為“模型需要上下文”(God is hungry for context)。

為了驗證這一觀點,Hylak 和他的團隊進行了一項測試。他們收集了公司過往的規劃會議紀要、目標文檔和語音備忘錄,將這些海量、具體的內部信息作為上下文,輸入給 o3-pro,并要求其制定一份公司未來發展計劃。據 Hylak 描述,o3-pro 輸出的計劃非常具體且切合實際,包含了可量化的指標、明確的時間線和任務優先級,甚至對哪些項目應該停止給出了堅決的建議。他認為,這份計劃的深度和可操作性,已經“真正改變了我們對未來的思考方式”。

o3-pro 之所以能做到這一點,關鍵在于其更強的環境感知和工具調用能力。它能更好地理解自身所處的運行環境和能力的邊界。Hylak 提供了兩個例子:

1. 環境感知:當被要求渲染一段 HTML 代碼時,o3-pro 沒有像其他模型一樣嘗試在不支持的環境中執行,而是明確告知用戶它無法直接渲染,并清晰地描述了代碼的預期視覺效果,同時指導用戶如何本地查看。


(來源:Latent Space)

2. 智能澄清與工具引導:當被要求查找關于作家博爾赫斯的最新文章時,o3-pro 首先主動提問以澄清具體指代的人物和用戶需求。在發現自身工具鏈無法直接完成實時搜索后,它沒有給出“找不到”的簡單答復,而是為用戶生成了一個精確的谷歌搜索指令,幫助用戶自行解決問題。

這些例子表明,o3-pro 在辨別環境、溝通自身能力、在信息不足時提問以及為任務選擇合適工具等方面,相比前代模型有了顯著進步。它更像一個能夠與人類、外部數據和其他工具協作的智能體。

當然,Hylak 也提到,在上下文不足時,o3-pro 可能會對簡單問題“過度思考”,且它更擅長作為任務的“編排者”而非直接的執行者。這進一步證實了新的交互模式:用戶需要提供高質量的上下文和清晰的目標,AI 則在此基礎上進行深度分析和規劃。

在 OpenAI 進行產品線調整的同一時期,其 CEO 薩姆·奧特曼發表了一篇題為《溫和的奇點》(The Gentle Singularity)的博文,闡述了他對當前 AI 技術發展階段的個人看法。


圖丨相關推文(來源:Sam Altman)

文章的核心觀點是,技術奇點并非一個突然爆發、顛覆一切的戲劇性事件,而是一個“溫和”的、漸進的、并且已經開始的過程。他描述道:“我們已經越過了事件視界;起飛已經開始……至少到目前為止,它比想象中要平淡得多。”

奧特曼用“奇跡變成常態,然后成為基本要求”來形容這個進程。他認為,社會對于 AI 能力的期望值會快速適應和提升。今天看來令人驚嘆的技術,明天可能就會成為標準配置。這種快速的常態化,是“溫和奇點”的主要特征。

他認為,驅動這一進程的核心是一種“遞歸式自我改進”的早期形式。即,人類已經可以利用現有的 AI 工具來輔助和加速 AI 自身的研究。如果 AI 能幫助科學家將原本需要數年的研究周期縮短到數月甚至數周,那么整體的科技進步速度將發生質變。

在博文中,奧特曼展望了一個“智能和能源”都將變得極其豐富的未來。他認為,科學進步是整體社會進步的最大驅動力,而 AI 將極大地加速科學進步。他還提出了一個觀點,即在未來,那些擁有好想法但缺乏技術實現能力的人(他稱之為“the idea guys”),將迎來他們的時代,因為強大的 AI 工具可以幫助他們將想法變為現實。

當然,奧特曼也承認這條道路上面臨著巨大的挑戰。他重申了解決“對齊問題”(alignment problem)的重要性,即確保 AI 系統的發展和行為符合人類的長期集體意愿。同時,他也強調了將 AI 技術帶來的益處進行廣泛分配的必要性。

One more thing,OpenAI 還宣布推遲其備受期待的開源模型的發布時間。奧特曼表示,由于研究上取得了“意想不到的”進展,需要更多時間完善,因此發布將延后至夏末。

參考資料:

1.https://platform.openai.com/docs/models/o3-pro

2.https://www.latent.space/p/o3-pro

3.https://blog.samaltman.com/the-gentle-singularity

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
37歲無臂網紅楊佩產子,雙腿累到虛脫,丈夫卻只顧著玩手機引熱議

37歲無臂網紅楊佩產子,雙腿累到虛脫,丈夫卻只顧著玩手機引熱議

楊哥歷史
2025-06-14 10:03:45
印度空難有新說法?機長生前留下3字,消息一出,美不許停飛波音

印度空難有新說法?機長生前留下3字,消息一出,美不許停飛波音

嘆知
2025-06-14 21:53:14
尤文欲簽安東尼,或用鐵腰與曼聯交換!范德薩建議阿莫林留下圓神

尤文欲簽安東尼,或用鐵腰與曼聯交換!范德薩建議阿莫林留下圓神

羅米的曼聯博客
2025-06-15 09:23:11
高考錄取狀態出現“這4個字”,大概率不會被錄取,25考生盡早了解

高考錄取狀態出現“這4個字”,大概率不會被錄取,25考生盡早了解

妍妍教育日記
2025-06-14 11:49:09
總理是叛徒?俄羅斯“最大內鬼”浮出水面,竟然一直藏在普京身邊

總理是叛徒?俄羅斯“最大內鬼”浮出水面,竟然一直藏在普京身邊

小lu侃侃而談
2025-06-10 20:06:43
AI這條鯰魚,終結了志愿填報的信息暴利

AI這條鯰魚,終結了志愿填報的信息暴利

吐槽青年
2025-06-14 10:32:23
雪上加霜!鄭欽文1-2出局后,又收到一個會壞消息,故意被針對?

雪上加霜!鄭欽文1-2出局后,又收到一個會壞消息,故意被針對?

體育就你秀
2025-06-15 06:50:37
突發:以色列對伊朗發動打擊

突發:以色列對伊朗發動打擊

澎湃新聞
2025-06-15 00:28:03
CBS評李月汝交易:飛翼獲評B+,李月汝有望直接進入首發陣容

CBS評李月汝交易:飛翼獲評B+,李月汝有望直接進入首發陣容

雷速體育
2025-06-15 07:33:16
誰錯了?我藏南國土并非9萬、印度實際只控制了6.8萬,冤枉它了?

誰錯了?我藏南國土并非9萬、印度實際只控制了6.8萬,冤枉它了?

阿燕姐說育兒
2025-06-14 13:46:52
上海63歲阿姨未婚未育,尋找40年前的空軍戀人,見到他后淚流滿面

上海63歲阿姨未婚未育,尋找40年前的空軍戀人,見到他后淚流滿面

夜闌故事集
2025-06-10 14:10:02
以色列和伊朗相隔1000多公里,并無領土爭端,為何以色列要揍伊朗

以色列和伊朗相隔1000多公里,并無領土爭端,為何以色列要揍伊朗

行走的知識庫
2025-06-14 07:48:23
伊朗:打擊美軍基地 下一輪對以襲擊導彈數是20倍

伊朗:打擊美軍基地 下一輪對以襲擊導彈數是20倍

看看新聞Knews
2025-06-14 20:25:47
無需催生!中國最愿意生孩子的省,連續六年全國第一,根本不用催

無需催生!中國最愿意生孩子的省,連續六年全國第一,根本不用催

青眼財經
2025-06-13 13:05:29
挖2棵以上就定罪!2024年廣東男子挖13萬斤,每斤賣8毛

挖2棵以上就定罪!2024年廣東男子挖13萬斤,每斤賣8毛

萬象硬核本尊
2025-06-13 11:37:17
99.75%的超高贊成率同意修改越南憲法

99.75%的超高贊成率同意修改越南憲法

李東海評論
2025-06-15 00:06:32
顛覆認知!男優嚴選「最想合作」女優紅黑榜揭曉 (2)

顛覆認知!男優嚴選「最想合作」女優紅黑榜揭曉 (2)

TVB的四小花
2025-06-15 05:56:17
今年擴招最猛的7所211大學,錄取分預計下降,550-600分重點關注

今年擴招最猛的7所211大學,錄取分預計下降,550-600分重點關注

狐貍先森講升學規劃
2025-06-14 21:19:18
杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場卻被伴娘攔下

杭州男子失戀游湖南,遇苗族婚宴隨禮1000入席,離場卻被伴娘攔下

蘭姐說故事
2025-06-09 10:00:07
下一個鄭欽文!10后中國小花崛起,連贏7場進決賽創造歷史

下一個鄭欽文!10后中國小花崛起,連贏7場進決賽創造歷史

全景體育V
2025-06-14 19:41:12
2025-06-15 11:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15294文章數 513782關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

親子
健康
游戲
時尚
本地

親子要聞

父親節快樂!海渡陽翔越來越棒啦,亞亞非常欣慰

呼吸科專家破解呼吸道九大謠言!

《誅仙世界》首次回應銀價暴跌;騰訊網易紛紛做出違背祖訓的決定

夏天最值得入手的6件單品,全在這了

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产乱人伦偷精品视频免下载| 日本护士毛茸茸| 无码成人片在线播放| 清纯唯美经典一区二区| 4444亚洲人成无码网在线观看| 白又丰满大屁股bbbbb| 无码国产精品一区二区免费模式| 久久不见久久见免费影院国语| 国产精品天干天干在线观看澳门| 久久久国产精品麻豆a片| 热re99久久6国产精品免费| 成年性生交大片免费看| 色五月丁香五月综合五月4438| 少妇呻吟白浆高潮啪啪69| 熟妇高潮精品一区二区三区| 欧美性生 活18~19| 激情呻吟久久久久久99av| 精品一区二区成人精品| 欧美伊人久久大香线蕉综合| 久久精品国产精品亚洲| 中文字幕肉感巨大的乳专区| 夜夜爽妓女8888视频免费观看| yy111111少妇无码影院| 在线涩涩免费观看国产精品| 夜夜躁狠狠躁2021| 国产亚洲熟妇在线视频| 亚洲中文字幕无码一久久区| 伊人久久大香线蕉av仙人| 思思久久精品一本到99热| 国产一在线精品一区在线观看| 麻豆精品久久久久久久99蜜桃| 久久一日本综合色鬼综合色| 全部孕妇毛片| 无码精品不卡一区二区三区| 日韩av无码中文一区二区三区| 久久久久人妻精品一区蜜桃网站| 免费无码又爽又刺激一高潮| 色一情一乱一伦麻豆| 四虎国产精品永久在线国在线| 男人添女人下部高潮视频| 国产精品毛片无码|