大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

o3-pro正式推出!說聲“嗨”就花了80美元,思考1+1用時16分鐘

0
分享至

OpenAI深夜放大招,正式推出“最新最強版”推理模型o3-pro

而且同一時間,o3模型降價80%不降智。



官方測評結果顯示,在專家評估中,所有人一致更偏愛o3-pro而非o3的回答。



此外,o3-pro也一舉超越o3、o1-pro,成為當前最擅長數學、科學和編程的OpenAI模型。



OpenAI CEO奧特曼也第一時間激動表示:

  • 這真是太聰明了!我第一次看到它相對于o3的勝率時,簡直不敢相信。



目前o3-pro已取代o1-pro,面向ChatGPT的Pro和Team用戶開放,Enterprise和Edu用戶將在下周獲得使用權限。

而對開發者來說,o3-pro已經可以通過API接入:

每百萬輸入tokens收費20美元(約合人民幣143元),每百萬輸出tokens收費80美元(約合人民幣574元)

有多貴呢?

溫馨提醒,據稱一句簡單的“嗨”就花了網友80美元(doge)。



或許OpenAI也意識到這個價格確實有點貴,所以另一邊趕緊宣布o3降價80%。



o3降價80%不降智

官網顯示,o3的最新API價格如下:

每百萬輸入tokens收費2美元,每百萬輸出tokens收費8美元。

對比o1-pro下降了80%以上,不僅是o3-pro的1/10,而且和GPT-4o(每百萬輸入/輸出分別為2.5美元和10美元)基本持平。



至于降價原因,明面上的說法是OpenAI對推理服務架構進行了全面優化。

就是說,雖然o3和o3-pro底層模型相同,但由于推理更高效,所以價格自然就下調了。

不過,就在奧特曼對這一價格“沾沾自喜”時,關于o3“是否真的沒有降智”卻陷入了爭議。



網友們也是相當直白,在奧特曼這條推文底下直接表達了懷疑:



甚至有博主以親身經歷(暫無法確定真實性)出來發聲,認為o3在實測中變笨了。

  • OpenAI降價并非出于慈善……



然而這一說法也遭到了其他網友的反駁,總體來看目前對峙雙方并未就這一爭議拿出實質性證據



雖然爭議尚未討論出具體結果,但一些關于o3-pro的測試結果已經新鮮出爐。

和開頭所提一致,官方在更嚴格的“4/4可靠性”評估中也驗證了o3-pro尤為擅長數學、科學和編程。

p.s. 這項評估需要o3-pro在四次嘗試中(而不僅僅是一次,pass@1)正確回答問題~



不過官方也多次提醒,由于o3-pro可以使用工具,因此響應時間通常比o1-pro更長

  • 我們建議將其用于對可靠性要求更高的棘手問題,等待幾分鐘是值得的。

這也和一眾網友實測下來的感受相符,o3-pro確實變強了,能夠解決一些其他模型無法答對的問題,不過由于響應變慢,價格也是真貴。

HyperWriteAI CEO讓它思考“1+1=?”,結果往往需要耗時1分鐘以上(第一次問甚至用時16分鐘)



當然,這也恰好代表了o3-pro的錯誤打開方式。

不論是官方建議還是一些好的網友實測結果,都說明o3-pro更適合挑戰一些有難度、有價值的問題

賓大教授Ethan Mollick分享了一個其他模型都曾鎩羽而歸的問題:從“SPACE”到“EARTH”制作一個單詞階梯。

這個游戲需要模型從“SPACE”到“EARTH”,每次只改變一個字母,單詞真實有效且長度不變(右側為解釋“為什么這是一個合法的英語單詞”)

而o3-pro成功完成了挑戰,并且這不是模型通過聯網搜索得到的答案(即通過推理得到)



另一位生物醫學科學家也分享了與o3-pro合作開發免疫系統的例子。

作為對比,他也向o3提出了同一任務(要求先識別出人類天然免疫系統的關鍵局限性),結果表明o3-pro更勝一籌。

  • o3列出的前五個問題雖然強調了類似的重要問題,但后兩個問題無需徹底重構免疫系統即可解決。
  • 相比之下,o3-pro不僅提出了更多限制,而且它所指出的每一個限制都是極其關鍵、內在的問題,需要徹底重構。



整體而言,通過ARC-AGI測試結果可以看到,o3-pro在高難任務上表現略好,但提升幅度不大,且成本隨難度上升。

p.s. 這項測試主要考驗AI在面對新問題時的抽象推理和問題解決能力~



奧特曼發小作文

  • 這是我最后一次在沒有任何人工智能幫助的情況下寫這樣的文章了。

有意思的是,同一時間奧特曼也火速發了一篇小作文——

題目為《The Gentle Singularity(溫和的奇點)》,來探討AI發展對人類社會的影響。



其主要觀點包括下面這些:

1、2025年,我們迎來了能夠真正進行認知工作的智能Agent,編寫計算機代碼的方式將徹底改變。2026年,我們很可能會看到能產生原創見解的系統;2027年,或許會出現能在現實世界中執行任務的機器人

2、到了2030年代,智慧和能源——即想法及實現想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的基本限制;如果智慧和能源變得充足(加上良好的治理),理論上我們可以實現一切。

3、隨著數據中心的生產逐漸自動化,智能的成本最終應該會接近電力成本。(很多人關心ChatGPT每次查詢用多少能量;平均每次查詢大約耗電0.34瓦時,大概相當于烤箱運行一秒多一點,或高效燈泡使用幾分鐘。此外,每次查詢大約用水0.000085加侖,約等于十五分之一茶匙。)

4、相比AI,人類有一個長期且重要的優勢:我們天生在意他人,以及他人怎么想、怎么做,而對機器卻沒什么感情。

5、從相對論的角度看,奇點是一點點發生的,融合是逐步進行的。我們正攀登那條技術指數增長的長弧線;向前看總覺得是陡峭的垂直,向后看則像是平緩的線,但其實它是一條平滑的曲線。(回想2020 年,如果那時我們說2025年會接近 AGI,聽起來會很瘋狂,但對比過去五年所發生的一切,也許現在的預測不那么瘋狂了。)

6、我們(整個行業,不只是OpenAI)正在為世界構建一個大腦,它的極限將取決于我們的好點子。

7、OpenAI如今做的事情很多,但最根本的身份仍是一個超級智能研究公司

BTW,奧特曼最新推文有透露,原計劃中的公開權重模型要推遲了。



嗯,又一個期貨(doge)~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅帥宇離世一年終上熱搜!真相就在16斤的材料里,就差你一聲吶喊

羅帥宇離世一年終上熱搜!真相就在16斤的材料里,就差你一聲吶喊

昨夜軍帖
2025-06-12 13:23:43
小米發了個199的新品,把所有網友都整不會了

小米發了個199的新品,把所有網友都整不會了

鋒潮評測
2025-06-13 16:24:07
生于1984年,賈牧樵擬提名為黑龍江省地級市副市長人選

生于1984年,賈牧樵擬提名為黑龍江省地級市副市長人選

澎湃新聞
2025-06-13 16:34:32
俄宣布將在烏茲別克斯坦合作建設兩座核電站

俄宣布將在烏茲別克斯坦合作建設兩座核電站

財聯社
2025-06-12 17:04:07
殺人嫌犯因精神分裂取保,批捕前失蹤,后被宣布“死亡”,崇左市通報:全面啟動核查復查

殺人嫌犯因精神分裂取保,批捕前失蹤,后被宣布“死亡”,崇左市通報:全面啟動核查復查

揚子晚報
2025-06-13 18:12:05
19歲學霸因差6分滿分跳樓身亡,更多內幕曝光,一細節諷刺至極

19歲學霸因差6分滿分跳樓身亡,更多內幕曝光,一細節諷刺至極

溫柔看世界
2025-06-12 11:57:26
國防部:中方致力于推動中美兩軍關系穩定、健康、可持續發展

國防部:中方致力于推動中美兩軍關系穩定、健康、可持續發展

環球網資訊
2025-06-13 19:50:40
痛心!王振同志在江西辦案期間不幸去世,年僅35歲

痛心!王振同志在江西辦案期間不幸去世,年僅35歲

魯中晨報
2025-06-12 17:02:14
男孩高考只差1分一本,父親托關系查看試卷,試卷上5個字讓他傻眼

男孩高考只差1分一本,父親托關系查看試卷,試卷上5個字讓他傻眼

球場的看客
2025-06-11 19:36:13
中國立大功!研發全球首款新型細胞制劑,20分鐘治愈多名糖尿病者

中國立大功!研發全球首款新型細胞制劑,20分鐘治愈多名糖尿病者

科學認識論
2025-06-13 16:25:34
悲催!網傳贛州一家具廠倒閉,3個月工資沒發,欠貨款l000多萬…

悲催!網傳贛州一家具廠倒閉,3個月工資沒發,欠貨款l000多萬…

火山詩話
2025-06-13 08:54:50
連撞15臺車,鄭州小米美女車主賬號被扒:提車啦,開上啦,報廢啦

連撞15臺車,鄭州小米美女車主賬號被扒:提車啦,開上啦,報廢啦

火山詩話
2025-06-13 06:04:40
下周四川盆地或出現破紀錄高溫!16日起40℃熱浪卷土重來

下周四川盆地或出現破紀錄高溫!16日起40℃熱浪卷土重來

紅星新聞
2025-06-13 11:11:14
演員陳龍回爸媽家吃飯,3盤咸菜4個剩飯,老兩口斗嘴能把人笑趴下

演員陳龍回爸媽家吃飯,3盤咸菜4個剩飯,老兩口斗嘴能把人笑趴下

小咪侃娛圈
2025-06-13 09:23:40
我真的值4000萬!本賽季證明自己的5位億元先生,哈利伯頓上榜

我真的值4000萬!本賽季證明自己的5位億元先生,哈利伯頓上榜

大衛的籃球故事
2025-06-12 19:47:14
“中產階級”及格線出來了!全國總共才3320萬戶?你達標了嗎?

“中產階級”及格線出來了!全國總共才3320萬戶?你達標了嗎?

巢客HOME
2025-06-05 16:15:03
呂一曬出北京80平的小家,自嘲房子小,家里沒有老公生活過的痕跡

呂一曬出北京80平的小家,自嘲房子小,家里沒有老公生活過的痕跡

大笑江湖史
2025-06-13 14:58:19
“想裝還舍不得花錢”10歲女孩生日大排宴宴,被網友扒出團購訂單

“想裝還舍不得花錢”10歲女孩生日大排宴宴,被網友扒出團購訂單

知曉科普
2025-06-13 11:48:53
馬克龍反對武統,卻在特朗普接到訪華邀請后,宣布:議員竄臺6日

馬克龍反對武統,卻在特朗普接到訪華邀請后,宣布:議員竄臺6日

阿鄖田間生活
2025-06-13 12:41:00
以色列知道機密已泄露,準備對伊朗發起行動,美使館第一時間撤離

以色列知道機密已泄露,準備對伊朗發起行動,美使館第一時間撤離

掌青說歷史
2025-06-12 16:11:58
2025-06-13 20:43:00
量子位 incentive-icons
量子位
追蹤人工智能動態
10659文章數 176166關注度
往期回顧 全部

科技要聞

報志愿非得花上萬元找"張雪峰"?AI行不行

頭條要聞

媒體:伊朗支持的多組織都受重創 留給其的時間不多了

頭條要聞

媒體:伊朗支持的多組織都受重創 留給其的時間不多了

體育要聞

世界第一和他背后的智囊

娛樂要聞

宋茜壓軸風波升級!官方下場暗示順序

財經要聞

5月M2同增7.9% 前5個月存款增14.73萬億

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

時尚
本地
藝術
房產
軍事航空

夏天衣服不用準備太多,這幾件單品可常備,日常穿搭綽綽有余

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產要聞

18位頂級買家瘋搶!凱旋新世界,憑何成為廣州頂豪終極價值錨點?

軍事要聞

伊朗多名將領、核科學家遇襲身亡 身份披露

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人人妻人人做人人爽夜欢视频| 国产成人久久精品激情| 果冻传媒一区二区天美传媒| 国产成人18黄网站| 男人边吃奶边做好爽免费视频| 国产乱子伦农村xxxx| 国产成人精品免费久久久久| 日韩精品射精管理在线观看| 亚洲人禽杂交av片久久| 99久久99久久久精品齐齐综合色圆| 无码少妇一区二区浪潮免费| 97久久人人超碰超碰窝窝| 中文字幕乱码人在线视频1区| 米奇777四色精品人人爽| 福利视频在线播放| 亚洲精品一线二线三线无人区| 丰满人妻熟妇乱又伦精品视| 国产精品毛片a∨一区二区三区| 国产乱妇无码大片在线观看| 无码一区18禁3d| 亚洲精品色无码av试看| 东京热无码人妻系列综合网站| 4399理论片午午伦夜理片| 韩国主播av福利一区二区| 成人性生交大片免费| 国产v精品成人免费视频| 成人色视频| 久久精品国产精品亚洲蜜月| 女人和拘做受全程看视频| 久久久久香蕉国产线看观看伊| 亚洲无码精品视频| 久久综合老色鬼网站| av在线 亚洲 天堂| 人妻人人做人碰人人添| 亚洲av无码精品色午夜蛋壳| 久久婷婷丁香七月色综合| 久久久久人妻精品一区三寸| 国产精品人妻熟女男人的天堂| 日产中文字幕在线精品一区| 亚洲欧美中文日韩在线v日本| 国产午国产午夜精华 免费|