新智元報(bào)道
編輯:桃子 好困
【新智元導(dǎo)讀】o3-mini深夜降臨,OpenAI終于亮出了最新的底牌。在Reddit AMA問答中,奧特曼深刻懺悔在開源AI上,自己站錯(cuò)了隊(duì)。他表示,內(nèi)部正在考慮開源策略,繼續(xù)研發(fā)模型,但OpenAI領(lǐng)先優(yōu)勢不會(huì)像以前那么大了。
當(dāng)所有人還在驚嘆DeepSeek的驚人實(shí)力時(shí),OpenAI終于坐不住了。
昨夜凌晨,。
最關(guān)鍵的是,免費(fèi)用戶也可以體驗(yàn)!
o3-mini實(shí)力可不是吹的,在「人類最后一次考試」中,o3-mini(high)直接在準(zhǔn)確率和校準(zhǔn)誤差(Calibration Error)均是最優(yōu)。
o3-mini上線幾小時(shí)后,OpenAI官方開啟了Reddit AMA大約1小時(shí)左右的在線問答。
奧特曼本人也上線,回答了網(wǎng)友們的一切問題。
主要精彩亮點(diǎn)有:
DeepSeek的確很優(yōu)秀,我們也會(huì)繼續(xù)研發(fā)更好的模型,但領(lǐng)先優(yōu)勢不會(huì)像以前那么大了
比起幾年前,我現(xiàn)在更傾向于認(rèn)為AI可能會(huì)出現(xiàn)快速突飛猛進(jìn)
在開源權(quán)重AI模型這個(gè)問題上,我們站錯(cuò)了隊(duì)
高級(jí)語音模式即將迎來更新,我們會(huì)直接稱它為GPT-5,而不是GPT-5o,目前還沒有具體的時(shí)間表。
除了奧特曼本人,首席研究官M(fèi)ark Chen、首席產(chǎn)品官Kevin Weil、工程副總Srinivas Narayanan、API研究負(fù)責(zé)人Michelle Pokrass、研究負(fù)責(zé)人Hongyu Ren也一同在線,認(rèn)真回答了網(wǎng)友們所有問題。
接下來,讓我們一起看看他們都說了什么。
奧特曼深刻懺悔,在開源AI上站錯(cuò)了隊(duì)
DeepSeek突然逆襲,或許是所有人都沒有想到的。
在AMA問答中,奧特曼本人也深深懺悔自己在開源AI上站錯(cuò)了隊(duì),不得不承認(rèn)DeepSeek的強(qiáng)大優(yōu)勢。
讓許多人驚嘆不已的是,奧特曼竟然說出,OpenAI領(lǐng)先優(yōu)勢不如以往。
以下所有,是我們匯總的奧特曼的經(jīng)典回答。
Q:讓我們來談?wù)劚局艿闹卮笤掝}:Deepseek。顯然這是一個(gè)非常令人印象深刻的模型,我也知道它可能是在其他LLM的輸出基礎(chǔ)上訓(xùn)練的。這會(huì)如何改變你們對(duì)未來模型的計(jì)劃?
奧特曼:它確實(shí)是一個(gè)非常好的模型!我們會(huì)開發(fā)出更好的模型,但我們不會(huì)像往年那樣保持那么大的領(lǐng)先優(yōu)勢了。
Q:你認(rèn)為遞歸式自我改進(jìn)會(huì)是一個(gè)漸進(jìn)的過程,還是一個(gè)突然起飛的過程?
奧特曼:我個(gè)人認(rèn)為,比起幾年前,我現(xiàn)在更傾向于認(rèn)為AI可能會(huì)出現(xiàn)快速突飛猛進(jìn)。可能是時(shí)候就這個(gè)話題寫點(diǎn)東西了...
Q:我們能看到模型思考的所有token嗎?
奧特曼:是的,我們很快就會(huì)展示一個(gè)更有幫助、更詳細(xì)的版本。感謝R1提供的更新信息。
首席產(chǎn)品官Kevin Weil:我們正在努力展示比現(xiàn)在更多的內(nèi)容——這將很快實(shí)現(xiàn)。至于是否展示所有內(nèi)容還有待確定,展示所有思維鏈(CoT)會(huì)導(dǎo)致競爭對(duì)手的模型蒸餾,但我們也知道用戶(至少是高級(jí)用戶)想要看到這些,所以我們會(huì)找到一個(gè)合適的平衡點(diǎn)。
Q:滿血版o3什么時(shí)候上線?
奧特曼:我估計(jì)會(huì)超過幾周,但不會(huì)超過幾個(gè) 月。
Q:語音模式會(huì)有更新嗎?這是否是潛在的GPT-5o關(guān)注的重點(diǎn)?GPT-5o的大致時(shí)間表是什么?
奧特曼:是的,高級(jí)語音模式的更新即將到來!我想我們會(huì)直接稱它為GPT-5,而不是GPT-5o。目前還沒有具體的時(shí)間表。
Q:你會(huì)考慮發(fā)布一些模型權(quán)重,并發(fā)表一些研究嗎?
奧特曼:是的,我們正在討論。我個(gè)人認(rèn)為,在這個(gè)問題上我們站錯(cuò)了隊(duì),需要想出一個(gè)不同的開源策略;不是OpenAI的每個(gè)人都持有這種觀點(diǎn),而且這也不是我們目前的最高優(yōu)先級(jí)。
再來一個(gè)問題彈:
我們距離在常規(guī)Plus計(jì)劃中提供Operator還有多遠(yuǎn)?
機(jī)器人部門的首要目標(biāo)是什么?
OpenAI如何看待更專業(yè)的芯片/TPU,比如Trillium、Cerebras等?OpenAI是否在關(guān)注這方面?
投資什么來對(duì)沖AGI和ASI未來的風(fēng)險(xiǎn)?
你最難忘的假期是什么?
奧特曼:
幾個(gè)月
先小規(guī)模生產(chǎn)一個(gè)真正優(yōu)秀的機(jī)器人,從中學(xué)習(xí)經(jīng)驗(yàn)
GB200目前很難被超越!
一個(gè)好的選擇是提升自己的內(nèi)在狀態(tài)——韌性、適應(yīng)力、平靜、快樂等
很難選擇!但首先想到的兩個(gè)是:在東南亞背包旅行或者非洲野生動(dòng)物園之旅
Q:你是否計(jì)劃對(duì)Plus系列產(chǎn)品進(jìn)行提價(jià)?
奧特曼:實(shí)際上我想逐漸減少。
Q:假設(shè)現(xiàn)在是2030年,你們剛剛創(chuàng)造了一個(gè)大多數(shù)人會(huì)稱之為AGI的系統(tǒng)。它在所有測試基準(zhǔn)上都表現(xiàn)出色,而且在速度和性能上都超過了你們最優(yōu)秀的工程師和研究人員。接下來怎么辦?除了「把它放到網(wǎng)站上提供服務(wù)」之外,還有其他計(jì)劃嗎?
奧特曼:在我看來,最重要的影響將是加速科學(xué)發(fā)現(xiàn)的速度,我認(rèn)為這是對(duì)提高生活質(zhì)量貢獻(xiàn)最大的因素。
4o圖像生成,快來了
接下來,補(bǔ)充的是其他OpenAI成員的回應(yīng)。
Q:你們還打算推出4o圖像生成器嗎?
首席產(chǎn)品官Kevin Weil:是的!我們正在努力。而且我認(rèn)為等待是值得的。
Q:太好了!有大致的時(shí)間表嗎?
首席產(chǎn)品官Kevin Weil:你這是想讓我惹麻煩啊。可能幾個(gè)月吧。
還有一個(gè)類似的問題。
Q:我們什么時(shí)候可以看到ChatGPT-5?
首席產(chǎn)品官Kevin Weil:就在o-17 micro和GPT-(π+1)之后不久。
又是一個(gè)問題彈:
我們還可以期待什么其他類型的智能體?
也為免費(fèi)用戶提供一個(gè)智能體,這樣可以加快采用率...
關(guān)于新版DALL·E有什么更新嗎?
最后一個(gè)問題,也是每個(gè)人都會(huì)問的...AGI什么時(shí)候?qū)崿F(xiàn)?
首席產(chǎn)品官Kevin Weil:
關(guān)于更多智能體:非常非常快就來了。我想你會(huì)滿意的。
基于4o的圖像生成:大約幾個(gè)月后,我迫不及待想讓你們用上。它很棒。
AGI:是的
Q:你們是否計(jì)劃在推理模型中添加文件附件功能?
工程副總Srinivas Narayanan:正在開發(fā)中。未來推理模型將能夠使用不同的工具,包括檢索功能。
首席產(chǎn)品官Kevin Weil:只是想說,我迫不及待想看到能使用工具的推理模型了 :)
Q:真的。當(dāng)你解決這個(gè)問題時(shí),一些非常有用的AI應(yīng)用場景就會(huì)被打開。想象一下,它能夠理解你500GB的工作文檔內(nèi)容。
當(dāng)你準(zhǔn)備回復(fù)一封郵件時(shí),在你的郵件應(yīng)用旁邊會(huì)打開一個(gè)面板,持續(xù)分析與這個(gè)人相關(guān)的所有信息,包括你們的關(guān)系、討論的主題、過去的工作等等。也許某個(gè)你早已遺忘的文檔中的內(nèi)容會(huì)被標(biāo)記出來,因?yàn)樗c當(dāng)前的討論非常相關(guān)。我太想要這個(gè)功能了。
工程副總Srinivas Narayanan:我們正在努力增加上下文長度。還沒有明確的日期/公告。
Q:「星際之門」項(xiàng)目對(duì)于OpenAI未來來說,有多重要?
首席產(chǎn)品官Kevin Weil:非常重要。我們所看到的一切都表明,我們擁有的計(jì)算能力越多,就能構(gòu)建越好的模型,也就能制造出越有價(jià)值的產(chǎn)品。
我們現(xiàn)在正在同時(shí)在兩個(gè)維度上擴(kuò)展模型——更大規(guī)模的預(yù)訓(xùn)練,以及更多的強(qiáng)化學(xué)習(xí)(RL)/「草莓」訓(xùn)練——這兩者都需要計(jì)算資源。
為數(shù)億用戶提供服務(wù)也需要計(jì)算資源!而且隨著我們轉(zhuǎn)向更多能持續(xù)為你工作的智能代理產(chǎn)品,這也需要計(jì)算資源。所以你可以把「星際之門」看作是我們的工廠,將電力/GPU轉(zhuǎn)化為令人驚嘆的產(chǎn)品的地方。
Q:在內(nèi)部,你們現(xiàn)在用的是哪個(gè)模型?o4、o5還是o6?與o3相比,這些內(nèi)部模型的智能程度提高了多少?
API研究負(fù)責(zé)人Michelle Pokrass:我們已經(jīng)數(shù)不清了。
Q:請(qǐng)?jiān)试S我們?cè)谑褂酶呒?jí)語音功能的同時(shí)與文本/畫布進(jìn)行交互。我希望能夠?qū)χf話,讓它對(duì)文檔進(jìn)行迭代修改。
首席產(chǎn)品官Kevin Weil:是的!我們有很多不錯(cuò)的工具是相對(duì)獨(dú)立開發(fā)的——目標(biāo)是讓這些工具盡快交到你手中。
下一步是整合所有這些功能,這樣你就可以與一個(gè)模型對(duì)話,它在搜索的同時(shí)進(jìn)行推理,并生成一個(gè)可以運(yùn)行Python的畫布。所有工具都需要更好地協(xié)同工作。另外順便說一下,所有模型都需要完整的工具使用能力(o系列模型目前還不能使用所有工具),這個(gè)也會(huì)實(shí)現(xiàn)的。
Q:o系列模型什么時(shí)候會(huì)支持ChatGPT中的記憶功能?
API研究負(fù)責(zé)人Michelle Pokrass:正在開發(fā)中!將我們所有的功能與o系列模型統(tǒng)一起來是我們的首要任務(wù)。
Q:4o是否會(huì)有重大改進(jìn)?我真的很喜歡自定義GPT,如果它能夠升級(jí)就太棒了,或者如果我們能夠在自定義GPT中選擇使用什么模型(比如o3 mini)就更好了。
API研究負(fù)責(zé)人Michelle Pokrass:是的,我們還沒有完成4o系列!
參考資料:
https://www.reddit.com/r/OpenAI/comments/1ieonxv/ama_with_openais_sam_altman_mark_chen_kevin_weil/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.