大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI推出首個Nano模型:GPT-4.1 ,百萬上下文、代碼能力大幅超越GPT4.5

0
分享至


OpenAI又放了個大招,正式在API中推出了全新的GPT-4.1系列模型!包括GPT-4.1GPT-4.1 miniGPT-4.1 nano三款新成員

引入首個Nano模型:GPT-4.1 nano是OpenAI迄今最快、最便宜的模型,雖然小,但能力不俗(MMLU 80.1%, GPQA 50.3%),同樣擁有100萬Token上下文,非常適合需要低延遲的場景

目前GPT-4.1系列僅通過API提供

簡單來說,這次更新的核心就是:代碼能力大幅提升、指令遵循重大改進、成本極其便宜!

劃重點

全面超越前輩:官方表示,新模型在各項能力上普遍優(yōu)于之前的GPT-4o和GPT-4o mini,更重要的是,無論你需要多快的響應速度,這個新系列總能提供一個比以往模型在同等速度下性能更好的選項,全面提升了不同應用場景下的性能標桿,比如,需要極低延遲的,可以用 Nano,它比之前的低延遲模型性能更好;需要中等平衡的,可以用 Mini,它提供了新的更優(yōu)平衡點;需要最高性能的,可以用 GPT-4.1,它在可接受延遲下性能更強


編程能力大幅躍升:在衡量真實世界軟件工程任務的SWE-bench Verified基準上,GPT-4.1得分54.6%,比GPT-4o絕對提升了21.4%,甚至比GPT-4.5還高了26.6%!妥妥的編碼利器


GPT-4.1 在前端編碼方面也比 GPT-4o 有了顯著提升,能夠創(chuàng)建功能更強大、更美觀的 Web 應用例如,讓4.1制作一個單詞卡web應用


指令遵循更可靠:在評估復雜指令遵循能力的Scale's MultiChallenge基準上,GPT-4.1得分38.3%,比GPT-4o絕對提升10.5%。這意味著它更能理解并執(zhí)行你的復雜要求,尤其是在多輪對話中,能更好地追蹤上下文信息


IFEval得分也從81.0%提升到87.4%( 在 IFEval? 中 ,模型必須生成符合各種指令的答案 )


OpenAI內(nèi)部開發(fā)的評估測試(困難提示遵循)


百萬級Token上下文窗口:全系列(包括mini和nano)都支持高達100萬Token的上下文窗口(之前GPT-4o是12.8萬),處理超長文檔、代碼庫不再是難題。而且,不是簡單加長,長文本理解能力也同步增強,"大海撈針"測試(Needle in a Haystack)在100萬Token范圍內(nèi)各位置都能精準找回信息


視覺理解新SOTA:GPT-4.1 系列在圖像理解方面非常強大,尤其是 GPT-4.1 mini 代表了重大的飛躍

在 MMMU? 中 ,模型可以回答包含圖表、示意圖、地圖等復雜圖像問題


在數(shù)學視覺任務中也很強大


解決科學論文中的圖表能力表現(xiàn):


Video-MME(無字幕長視頻理解)基準上,GPT-4.1取得了72.0%的成績,比GPT-4o提升了6.7%,創(chuàng)下新紀錄


知識更新:知識庫截止日期更新到了2024年6月

使用成本

模型

輸入 (每百萬Token)

緩存輸入 (每百萬Token)

輸出 (每百萬Token)

混合定價* (每百萬Token)

gpt-4.1

$2.00

$0.50

$8.00

$1.84gpt-4.1-mini

$0.40

$0.10

$1.60

$0.42gpt-4.1-nano

$0.10

$0.025

$0.40

$0.12


Nano 已經(jīng)比deepseek R1的價格還要便宜了


*基于典型輸入/輸出和緩存比例估算

  • ?GPT-4.1比GPT-4o中位數(shù)查詢便宜26%

  • ?Nano模型價格極具競爭力

  • ? 重復上下文的提示緩存(Prompt Caching)折扣提高到75%(原為50%)

  • ? 長上下文請求不額外收費

  • ?Batch API調(diào)用還有額外**50%**的折扣

一些細節(jié)代碼 (Coding):

除了SWE-bench,在Aider的polyglot diff基準上,GPT-4.1分數(shù)是GPT-4o的兩倍多,甚至比GPT-4.5高8%,尤其擅長生成可靠的代碼差異(diff format),節(jié)省token和延遲


前端代碼生成能力顯著增強,更美觀實用,80%的情況下人類評分員更喜歡GPT-4.1生成的網(wǎng)站。

更少出現(xiàn)無關(guān)代碼編輯(內(nèi)部評估從9%降至2%)

真實案例:Windsurf測試中得分比GPT-4o高60%;Qodo代碼評審測試中55%情況下優(yōu)于其他模型

指令遵循 (Instruction Following):

在格式遵循(XML, YAML等)、否定指令、順序指令、內(nèi)容要求、排序、避免過度自信等方面都有改進,尤其擅長處理困難提示

多輪對話能力增強,能更好地利用歷史信息。

注意:模型可能更“字面化”理解指令,建議提示詞寫得更明確、具體

真實案例:Blue J稅務場景準確率提升53%;Hex SQL生成改進近2倍,減少手動調(diào)試

長上下文 (Long Context):

100萬Token相當于8倍React完整代碼庫的大小

不僅能“大海撈針”,還能處理更復雜的長文本任務。OpenAI開源了兩個新評測集:OpenAI-MRCR(多輪指代消解,測試在長文本中區(qū)分多個相似信息點的能力)


Graphwalks(多跳推理,模擬代碼庫跳轉(zhuǎn)或文檔交叉引用)。GPT-4.1在這些任務上表現(xiàn)優(yōu)異


真實案例:Thomson Reuters在CoCounsel法律助手中,多文檔審閱準確率提升17%;Carlyle在處理復雜金融文檔(PDF, Excel)時,檢索性能提升50%,克服了以往模型的局限。

延遲:GPT-4.1在12.8萬Token輸入時,首個Token響應時間(p95)約15秒,百萬Token時可能達半分鐘;Nano在12.8萬輸入時,通常5秒內(nèi)返回首個Token

OpenAI把4.1模型比作類星體,不得不說,這炒作能力還是很高的


另外,

ChatGPT中的GPT-4o會逐步融合這些改進,但不是直接升級到GPT-4.1

GPT-4.5 Preview即將下線:由于GPT-4.1在性能、成本、延遲上更有優(yōu)勢,GPT-4.5 Preview(作為研究預覽版發(fā)布)將在2025年7月14日正式關(guān)閉,開發(fā)者有三個月過渡時間。OpenAI表示會將其優(yōu)點(創(chuàng)意、寫作質(zhì)量等)融入未來的API模型

個人感覺4.1這個模型更多的是在工程能力的細節(jié)處進行了非常扎實的改進

參考:

https://openai.com/index/gpt-4-1/

?星標AI寒武紀,好內(nèi)容不錯過?

用你的在看告訴我~

求贊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
鄭欽文1-2出局,無緣倫敦站決賽!仍獲56萬獎金,輸球原因揭曉

鄭欽文1-2出局,無緣倫敦站決賽!仍獲56萬獎金,輸球原因揭曉

小火箭愛體育
2025-06-15 01:09:17
顛覆認知!男優(yōu)嚴選「最想合作」女優(yōu)紅黑榜揭曉 (2)

顛覆認知!男優(yōu)嚴選「最想合作」女優(yōu)紅黑榜揭曉 (2)

TVB的四小花
2025-06-15 05:56:17
95年等待終結(jié)!安切洛蒂讓巴西覺醒,2026世界杯冠軍已在囊中?

95年等待終結(jié)!安切洛蒂讓巴西覺醒,2026世界杯冠軍已在囊中?

去山野間追風
2025-06-15 06:06:39
剛剛!泡泡瑪特宣布:暫停銷售!

剛剛!泡泡瑪特宣布:暫停銷售!

證券時報
2025-06-14 21:17:21
中國社會內(nèi)卷的真正原因!(深度好文)

中國社會內(nèi)卷的真正原因!(深度好文)

霹靂炮
2025-06-09 22:16:09
拉杜卡努:我和鄭欽文青少年時期就認識了;我們走的路不一樣

拉杜卡努:我和鄭欽文青少年時期就認識了;我們走的路不一樣

懂球帝
2025-06-15 01:13:10
國家動真格?刺激買房無效后,黃奇帆提“好方案”,獲得網(wǎng)友支持

國家動真格?刺激買房無效后,黃奇帆提“好方案”,獲得網(wǎng)友支持

墜入二次元的海洋
2025-06-15 05:46:15
下一個鄭欽文!10后中國小花崛起,連贏7場進決賽創(chuàng)造歷史

下一個鄭欽文!10后中國小花崛起,連贏7場進決賽創(chuàng)造歷史

全景體育V
2025-06-14 19:41:12
退休10年后被徹查,71歲崔國潮,被開除黨籍!

退休10年后被徹查,71歲崔國潮,被開除黨籍!

五月的書房
2025-06-10 15:50:46
是福是禍?中國2億老人混吃等死,陷入“廢物式”養(yǎng)老怪圈

是福是禍?中國2億老人混吃等死,陷入“廢物式”養(yǎng)老怪圈

訪史
2025-06-13 18:22:57
全市停辦!東莞公安最新通告

全市停辦!東莞公安最新通告

東莞紀實
2025-06-14 18:57:47
以色列軍方:已確認伊朗在生產(chǎn)核彈的武器零部件方面取得具體進展,表明伊朗政權(quán)正在接近無法回頭的地步

以色列軍方:已確認伊朗在生產(chǎn)核彈的武器零部件方面取得具體進展,表明伊朗政權(quán)正在接近無法回頭的地步

和訊網(wǎng)
2025-06-13 12:01:03
風仍在吹:內(nèi)伊說要終結(jié)以色列政權(quán),但結(jié)果即便神權(quán)保住也···

風仍在吹:內(nèi)伊說要終結(jié)以色列政權(quán),但結(jié)果即便神權(quán)保住也···

邵旭峰域
2025-06-14 12:12:16
特朗普提交其任內(nèi)首份公開財務披露報告:持股加密貨幣平臺獲超5700萬美元收益,234頁報告有145頁為股票債券投資記錄!

特朗普提交其任內(nèi)首份公開財務披露報告:持股加密貨幣平臺獲超5700萬美元收益,234頁報告有145頁為股票債券投資記錄!

每日經(jīng)濟新聞
2025-06-14 14:29:23
官宣!李月汝正式交易!中國女籃迎三好消息,打日本隊兩大殺手锏

官宣!李月汝正式交易!中國女籃迎三好消息,打日本隊兩大殺手锏

老吳說體育
2025-06-15 00:18:57
臺獨急先鋒賴清德突然改口:兩岸可以統(tǒng)一,國臺辦一句話讓其啞火

臺獨急先鋒賴清德突然改口:兩岸可以統(tǒng)一,國臺辦一句話讓其啞火

藍色海邊
2025-06-14 21:53:27
惡魔醫(yī)生劉翔峰,罪行累累,喪心病狂!

惡魔醫(yī)生劉翔峰,罪行累累,喪心病狂!

燕梳樓頻道
2025-06-12 22:49:14
現(xiàn)身邁阿密,Speed身穿C羅T恤觀戰(zhàn)世俱杯揭幕戰(zhàn)

現(xiàn)身邁阿密,Speed身穿C羅T恤觀戰(zhàn)世俱杯揭幕戰(zhàn)

懂球帝
2025-06-15 08:29:12
絲路古道煥新機

絲路古道煥新機

新華社
2025-06-13 13:31:36
羅馬仕發(fā)布公開聲明致歉

羅馬仕發(fā)布公開聲明致歉

最江陰
2025-06-14 21:27:30
2025-06-15 08:43:00
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領(lǐng)域
717文章數(shù) 313關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

伊朗近200枚導彈飛以色列 哈梅內(nèi)伊重要顧問傷重離世

頭條要聞

伊朗近200枚導彈飛以色列 哈梅內(nèi)伊重要顧問傷重離世

體育要聞

約戰(zhàn)天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個生日沒大S陪伴

財經(jīng)要聞

以伊沖突持續(xù)升級,對全球市場影響多大

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

教育
旅游
藝術(shù)
時尚
數(shù)碼

教育要聞

老師深夜邀約之謎:老師在群里要求四位家長,帶著撲克晚九點到校

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

夏天最值得入手的6件單品,全在這了

數(shù)碼要聞

4149元起,機械革命多款筆記本上架開售

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 欧美日韩不卡高清在线看| 亚洲精品久久久www小说| 中国老熟女重囗味hdxx| 中文字幕日韩三级片| 久久精品国产精品| y111111少妇影院无码| 日本免费一区二区三区最新| 成人国产精品??电影| 国产精品毛片久久久久久久| 内射毛片内射国产夫妻| 毛片免费观看天天干天天爽| 人妻被按摩到潮喷中文不卡| 亚洲影院丰满少妇中文字幕无码| 成人做爰视频www| 日日噜噜夜夜狠狠va视频v| 呦系列视频一区二区三区| 人妻少妇-嫩草影院| 小13箩利洗澡无码视频网站| 国产亚洲精品久久久久久动漫| 国产成人精品一区二三区| 国产九九99久久99大香伊| 国产高清一区二区三区直播| 日本高清成本人视频一区| 男女下面一进一出好爽视频| 饥渴少妇高潮视频大全| 亚洲精品第一国产综合精品| 特级a欧美做爰片第一次| 久久这里只有精品首页| 久久天天躁狠狠躁夜夜婷| 天天看片天天av免费观看| 国产精品久人妻精品老妇| 国产精品特级毛片一区二区三区| 丝袜无码一区二区三区| 69国产精品久久久久久人妻| 五月丁香六月综合缴清无码| 国产亚洲精品字幕在线观看| 黄色视频免费观看| 国产良妇出轨视频在线观看| 亚洲综合无码精品一区二区| 欧美日韩综合精品一区二区| 人妻aⅴ中文字幕|