大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

基準(zhǔn)測(cè)試揭秘大模型“字?jǐn)?shù)危機(jī)”:26個(gè)模型長(zhǎng)文本生成普遍拉胯

0
分享至

LIFEBench團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI

你是否曾對(duì)大語(yǔ)言模型(LLMs)下達(dá)過明確的“長(zhǎng)度指令”?

比如,“寫一篇10,000字的長(zhǎng)文,詳細(xì)分析某個(gè)議題。”看似簡(jiǎn)單的要求,實(shí)際卻往往讓這些模型“力不從心”:

不是生成內(nèi)容不足,就是重復(fù)啰嗦,甚至直接罷工拒絕生成。

一篇最新研究論文《LIFEBENCH: Evaluating Length Instruction Following in Large Language Models》對(duì)這一問題進(jìn)行了深入探討,提出了一個(gè)全新的基準(zhǔn)測(cè)試集 LIFEBENCH,系統(tǒng)評(píng)估大語(yǔ)言模型在長(zhǎng)度指令遵循方面的表現(xiàn)。

研究結(jié)果揭示:這些看似無(wú)所不能的模型在長(zhǎng)度指令,特別是長(zhǎng)文本生成任務(wù)中,表現(xiàn)不盡人意。當(dāng)模型被明確要求生成特定長(zhǎng)度的文本時(shí),大多數(shù)模型表現(xiàn)糟糕。

接下來(lái),讓我們一起來(lái)看看這篇論文是如何揭示這些“瓶頸”的!



LIFEBENCH:專注長(zhǎng)度指令遵循的基準(zhǔn)測(cè)試

LIFEBENCH,全稱“LengthInstructionFollowingEvaluationBenchmark”,是一套專門評(píng)估大語(yǔ)言模型在長(zhǎng)度指令下表現(xiàn)的測(cè)試集。它不僅覆蓋了從短篇到長(zhǎng)文的多種長(zhǎng)度范圍,還囊括了多種任務(wù)類型和語(yǔ)言,全面揭示了大模型在長(zhǎng)度控制上的能力邊界。



LIFEBENCH的三大核心特性:

數(shù)據(jù)集的多樣性

為了測(cè)試模型的全方位能力,LIFEBENCH設(shè)計(jì)了多維度的數(shù)據(jù)集:

  • 任務(wù)多樣性:涵蓋四類自然語(yǔ)言生成(NLG)任務(wù),包括問答、摘要、推理和創(chuàng)意生成,以全面評(píng)估模型的長(zhǎng)度指令遵循能力。
  • 長(zhǎng)短結(jié)合的輸入場(chǎng)景:測(cè)試數(shù)據(jù)既包含短輸入(<2000字),也包含長(zhǎng)輸入(>2000字),以評(píng)估模型在不同輸入規(guī)模下的表現(xiàn)。
  • 雙語(yǔ)支持:同時(shí)支持中文和英文任務(wù),分別從獨(dú)立數(shù)據(jù)集中構(gòu)建,以便分析模型是否存在語(yǔ)言偏差。

全面的長(zhǎng)度范圍與指令類型

LIFEBENCH是首個(gè)系統(tǒng)性評(píng)估模型長(zhǎng)度指令遵循能力的基準(zhǔn)測(cè)試,它設(shè)計(jì)了三種常見的長(zhǎng)度控制方法:

  • 等于(Equal To):生成長(zhǎng)度必須等于目標(biāo)長(zhǎng)度。
  • 不超過(At Most):生成長(zhǎng)度不得超過目標(biāo)長(zhǎng)度。
  • 至少(At Least):生成長(zhǎng)度必須達(dá)到目標(biāo)長(zhǎng)度。

同時(shí),長(zhǎng)度輸出范圍覆蓋從短文本(<100字)、中等長(zhǎng)度(100–2000字)到長(zhǎng)文本(>2000字)的任務(wù),評(píng)測(cè)的全面性遠(yuǎn)超以往研究。

創(chuàng)新的評(píng)測(cè)指標(biāo)

為了更精準(zhǔn)地分析模型的表現(xiàn),LIFEBENCH提出了兩項(xiàng)專門指標(biāo):
長(zhǎng)度偏差(Length Deviation, LD):衡量生成文本長(zhǎng)度與目標(biāo)長(zhǎng)度之間的差異,包括偏差方向和偏差幅度。



長(zhǎng)度評(píng)分(Length Score, LS):綜合評(píng)價(jià)模型對(duì)長(zhǎng)度指令的遵循能力,量化偏差的整體影響。



相較于簡(jiǎn)單的字?jǐn)?shù)匹配,這兩項(xiàng)指標(biāo)提供了更細(xì)致的分析維度。

通過上述設(shè)計(jì),LIFEBENCH不僅覆蓋了現(xiàn)有研究中涉及的所有長(zhǎng)度指令評(píng)測(cè)范圍,還首次系統(tǒng)性探索了模型在不同任務(wù)、語(yǔ)言和長(zhǎng)度限制下的表現(xiàn)。

實(shí)驗(yàn)結(jié)果:大語(yǔ)言模型的“長(zhǎng)度危機(jī)”

研究團(tuán)隊(duì)對(duì)26個(gè)主流大語(yǔ)言模型進(jìn)行了評(píng)測(cè),結(jié)果揭示了它們?cè)陂L(zhǎng)度指令遵循上的重大不足,尤其是在長(zhǎng)文本生成場(chǎng)景下。以下是一些關(guān)鍵發(fā)現(xiàn):

1. 總體表現(xiàn):長(zhǎng)度指令“等于”最難達(dá)標(biāo)

當(dāng)模型被明確要求生成特定長(zhǎng)度的文本時(shí),大多數(shù)模型表現(xiàn)糟糕。

在26個(gè)模型中,有23個(gè)模型的長(zhǎng)度評(píng)分(LS)低于60分,只有少數(shù)模型(如o3-mini、Claude-Sonnet-Thinking和Gemini-2.5-Pro)勉強(qiáng)達(dá)到了75.4分、61.3分和60分。

在“不超過”(At Most)和“至少”(At Least)指令下,由于限制更寬松,模型表現(xiàn)顯著改善。其中,有19個(gè)模型在“不超過”指令下的長(zhǎng)度評(píng)分超過90分,而“至少”指令下也有6個(gè)模型表現(xiàn)優(yōu)異。

2. 長(zhǎng)文本生成:模型普遍“拉胯”

大多數(shù)模型在短文本限制下表現(xiàn)穩(wěn)定,如o3-mini和Gemini-2.5-Pro分別獲得了80分和70分以上的長(zhǎng)度評(píng)分。隨著長(zhǎng)度限制增加,模型的表現(xiàn)開始下降。雖然o3-mini依然保持了較強(qiáng)的穩(wěn)定性(評(píng)分>70),但Gemini-2.5-Pro的評(píng)分從81分驟降至37分。

在長(zhǎng)文本生成任務(wù)中,所有模型的長(zhǎng)度評(píng)分均顯著下降,普遍低于40分,長(zhǎng)文本生成成為模型的最大挑戰(zhàn)。

3. 輸入特性:任務(wù)與語(yǔ)言的雙重影響

模型在不同任務(wù)中的表現(xiàn)差異顯著。摘要任務(wù)的長(zhǎng)度評(píng)分最低,有19個(gè)模型在這一任務(wù)中的表現(xiàn)顯著下降,創(chuàng)意生成任務(wù)的評(píng)分則最高,14個(gè)模型表現(xiàn)優(yōu)異。

幾乎所有模型在中文任務(wù)中的表現(xiàn)均劣于英文任務(wù)。此外,模型在處理中文指令時(shí),出現(xiàn)了明顯的“過度生成”現(xiàn)象,可能反映了模型對(duì)中文數(shù)據(jù)的處理能力不足。



模型“過度宣傳”了它們的最大輸出長(zhǎng)度

當(dāng)面對(duì)極限長(zhǎng)度指令時(shí)(比如“至少生成32,768字”),大部分大語(yǔ)言模型的表現(xiàn)堪稱“言過其實(shí)”。它們的宣傳似乎暗示自己是“長(zhǎng)篇巨制大師”,但實(shí)際生成結(jié)果卻經(jīng)常讓人失望。研究發(fā)現(xiàn):

1. 僅少數(shù)模型達(dá)標(biāo)

在26個(gè)模型中,只有Claude系列和Qwen系列的7個(gè)模型能在其10%最長(zhǎng)輸出中勉強(qiáng)符合長(zhǎng)度要求。如果將目標(biāo)放寬到25%最長(zhǎng)輸出,情況依然不樂觀——只有Qwen2.5-72B-Instruct和Qwen3-235B-A22B達(dá)到了設(shè)定的長(zhǎng)度要求。這些模型雖然聲明的最大輸出長(zhǎng)度較其他模型“低調(diào)”許多,但恰恰因?yàn)槿绱耍鼈兊谋憩F(xiàn)更接近實(shí)際能力,算得上“務(wù)實(shí)派”。

2. 大部分模型表現(xiàn)不符預(yù)期

其他模型則頗具“宣傳藝術(shù)”。除Gemini-2.0-Flash和部分Qwen系列模型因最大token限制受限外,其余模型的表現(xiàn)遠(yuǎn)低于它們聲稱的“最大輸出能力”。換句話說(shuō),這些模型的不足并不是因?yàn)闊o(wú)法達(dá)到技術(shù)上限,而是生成能力本身存在局限性。

有些模型在宣傳時(shí)或許給人一種“我可以寫出戰(zhàn)爭(zhēng)與和平”的錯(cuò)覺,但實(shí)際上,生成一篇“長(zhǎng)篇朋友圈”都可能顯得力不從心。



模型遵循長(zhǎng)度指令的三大“瓶頸”

基于上面的實(shí)驗(yàn)結(jié)果,論文深入分析了這個(gè)問題,總結(jié)出以下三大核心瓶頸:

1. 缺乏準(zhǔn)確的長(zhǎng)度感知能力

很多模型在“理解”目標(biāo)長(zhǎng)度上顯得模糊不清:短輸出任務(wù)時(shí)高估長(zhǎng)度:目標(biāo)是100字,模型可能“熱情過度”寫到150字。而長(zhǎng)輸出任務(wù)時(shí)反而低估長(zhǎng)度:目標(biāo)是5000字,模型卻生成3000字,仿佛在說(shuō)“這么長(zhǎng),夠用了吧?”,除此之外模型還有假遵循現(xiàn)象:有些模型生成后自信滿滿地“認(rèn)為自己已經(jīng)完成了任務(wù)”,但實(shí)際結(jié)果卻大相徑庭:這種現(xiàn)象表明,模型更像是在“自我感覺良好”,而非真正理解并執(zhí)行了指令。



2. 對(duì)輸入長(zhǎng)度的敏感性

輸入文本的長(zhǎng)度對(duì)模型的表現(xiàn)影響很大,當(dāng)輸入過長(zhǎng)時(shí),模型就有些“暈頭轉(zhuǎn)向”了,特別是在長(zhǎng)輸入場(chǎng)景(>5000字)中。

這也解釋了為什么摘要任務(wù)尤為糟糕:面對(duì)長(zhǎng)篇輸入時(shí),模型不僅難以提取關(guān)鍵內(nèi)容,還會(huì)生成過短或過長(zhǎng)的內(nèi)容,嚴(yán)重偏離指令要求。可以說(shuō),輸入越長(zhǎng),模型越容易“迷失在海量信息中”。

3. 懶惰生成策略

當(dāng)面臨復(fù)雜的長(zhǎng)文本任務(wù)時(shí),許多模型選擇了“偷懶”:

提前終止:有些模型會(huì)在未完成任務(wù)的情況下突然“省略”后續(xù)部分,例如直接插入提示“(接下來(lái)還有6000字)”,仿佛在暗示“我知道還沒寫完,但后面的就不寫了”。

拒絕生成:在遇到超長(zhǎng)的任務(wù)時(shí),一些模型會(huì)直接選擇放棄,例如明確表示“你的要求長(zhǎng)度已經(jīng)超過了我的能力極限,無(wú)法完成”。這種情況下,模型既沒有嘗試生成部分內(nèi)容,也沒有提供替代方案,而是干脆拒絕執(zhí)行指令。

研究發(fā)現(xiàn),當(dāng)目標(biāo)長(zhǎng)度超過8192字時(shí),拒絕生成的比例顯著上升,所有模型中平均超過10%因這種懶惰策略而失敗。顯然,越復(fù)雜的任務(wù),模型越傾向于“放棄治療”。



除了上面的三個(gè)瓶頸,有一些模型也嘗試解決這個(gè)問題:

4. 動(dòng)態(tài)校準(zhǔn)的局限性:一場(chǎng)“低效的修補(bǔ)”

為了糾正長(zhǎng)度偏差,一些推理模型嘗試了動(dòng)態(tài)校準(zhǔn):

他們會(huì)在推理過程總生成初稿后逐字統(tǒng)計(jì)輸出長(zhǎng)度,發(fā)現(xiàn)長(zhǎng)度不符時(shí)選擇重新生成,如此往復(fù),直至接近目標(biāo)長(zhǎng)度。

雖然這個(gè)方法在短文本任務(wù)中相對(duì)有效,但是耗時(shí)耗力,因?yàn)閯?dòng)態(tài)校準(zhǔn)需要耗費(fèi)大量計(jì)算資源和生成token,大幅增加時(shí)間成本。而且動(dòng)態(tài)校準(zhǔn)在長(zhǎng)文本場(chǎng)景中就會(huì)失效:由于校準(zhǔn)過程過于低效,模型無(wú)法在長(zhǎng)文本任務(wù)中維持相似的策略,最終還是無(wú)法完成指定長(zhǎng)度的內(nèi)容。

換句話說(shuō),動(dòng)態(tài)校準(zhǔn)看似“聰明”,但面對(duì)長(zhǎng)文本時(shí),最終還是成了一場(chǎng)“得不償失”的努力。

從三大“瓶頸”到動(dòng)態(tài)校準(zhǔn)的局限性,我們可以看到:大語(yǔ)言模型在長(zhǎng)度指令遵循上的表現(xiàn)還有很多不足。要讓這些模型真正“聽話”,需要在感知能力、信息處理能力和生成策略上進(jìn)行全面優(yōu)化。

深挖模型長(zhǎng)度指令遵循的隱藏問題

通過更深入的分析,研究揭示了一些隱藏在模型長(zhǎng)度指令遵循能力背后的有趣現(xiàn)象和改進(jìn)可能。以下是關(guān)鍵發(fā)現(xiàn):



1. 長(zhǎng)文本生成質(zhì)量的“起伏之路”

模型在不同長(zhǎng)度限制下的表現(xiàn)如同一條“起伏的曲線”:

短文本(512字):“還行”:生成質(zhì)量較高。

中等長(zhǎng)度(1024–2048字):“巔峰表現(xiàn)”:大多數(shù)模型在這個(gè)區(qū)間表現(xiàn)最好,輸出邏輯清晰,內(nèi)容質(zhì)量穩(wěn)定。

長(zhǎng)文本(4096–8192字):“質(zhì)量滑坡”:許多模型在此階段開始掉鏈子,生成內(nèi)容重復(fù)甚至拒絕生成。例如,有些模型會(huì)在生成到一半時(shí)插入“(接下來(lái)還有6000字)”,直接“擺爛”。

少數(shù)模型(如Claude-3.7-Sonnet)在超長(zhǎng)文本上偶爾“逆風(fēng)翻盤”,但這類情況較為罕見。大多數(shù)模型的長(zhǎng)文本內(nèi)容,質(zhì)量隨長(zhǎng)度增加而顯著下降,重復(fù)問題尤為突出。

2. 格式化輸出的“疊加挑戰(zhàn)”

在要求遵循長(zhǎng)度指令的同時(shí),還需要生成特定格式(如Markdown、HTML或LaTeX)時(shí),模型的表現(xiàn)進(jìn)一步惡化,復(fù)雜格式讓模型“抓狂”:格式越復(fù)雜,模型越容易出錯(cuò),甚至格式和內(nèi)容雙雙崩潰。

長(zhǎng)文本中的額外壓力:在8192字限制下,生成一篇帶復(fù)雜格式的文檔對(duì)模型來(lái)說(shuō)幾乎是“地獄難度”。生成的內(nèi)容不僅格式錯(cuò)誤,甚至可能中途放棄,輸出一堆不完整的內(nèi)容片段。

3. EoS信號(hào)的“提前規(guī)劃”

在長(zhǎng)文本生成任務(wù)中,EoS(End of Sequence,生成結(jié)束信號(hào)) token的異常行為揭示出一些有趣的現(xiàn)象:

短文本時(shí)表現(xiàn)乖巧:在2000字以下的限制下,模型的EoS預(yù)測(cè)較為正常,生成內(nèi)容完整且符合目標(biāo)要求,EoS信號(hào)通常在內(nèi)容接近目標(biāo)長(zhǎng)度時(shí)觸發(fā)。

長(zhǎng)文本時(shí)“提前規(guī)劃”傾向:當(dāng)目標(biāo)長(zhǎng)度達(dá)到4096或8192字時(shí),模型的行為變得耐人尋味——它似乎在生成開始前就“打好了自己的算盤”。EoS信號(hào)的觸發(fā)概率一開始就顯著升高,導(dǎo)致生成的內(nèi)容遠(yuǎn)遠(yuǎn)少于目標(biāo)長(zhǎng)度,甚至僅生成寥寥數(shù)百字便戛然而止。這種現(xiàn)象表明,模型在生成之前可能已經(jīng)“規(guī)劃”好了要寫多少,而不是在生成過程中逐步調(diào)整。

這種提前終止的行為可能源于模型在長(zhǎng)文本生成中的不確定性或自我限制,反映了其對(duì)任務(wù)長(zhǎng)度的規(guī)劃能力仍存在局限性。模型在面對(duì)超長(zhǎng)文本指令時(shí),可能會(huì)傾向于“保守估計(jì)”,提前結(jié)束生成以避免過度消耗計(jì)算資源或偏離任務(wù)要求。

4. 預(yù)訓(xùn)練與后訓(xùn)練的“雙管齊下”

模型在長(zhǎng)文本生成中的不足,既源于預(yù)訓(xùn)練的限制,也可以通過后訓(xùn)練優(yōu)化:

預(yù)訓(xùn)練的“偷懶基因”:由于預(yù)訓(xùn)練階段長(zhǎng)文本數(shù)據(jù)覆蓋不足,模型可能學(xué)到了一些“偷懶策略”,比如提前終止或拒絕回答,以規(guī)避長(zhǎng)文本中的復(fù)雜邏輯和連貫性問題。

后訓(xùn)練的“預(yù)規(guī)劃策略”:后訓(xùn)練提供了改進(jìn)的機(jī)會(huì)。通過讓模型在生成前先規(guī)劃整體結(jié)構(gòu)或章節(jié)大綱,生成內(nèi)容更貼合長(zhǎng)度要求,邏輯也更加清晰。例如,模型可以先生成“目錄”,再逐步填充內(nèi)容。這種方法顯著提升了長(zhǎng)文本的質(zhì)量,且讓模型對(duì)長(zhǎng)度指令的遵循更為精準(zhǔn)。

從生成質(zhì)量的“起伏之路”到復(fù)雜格式的雙重挑戰(zhàn),再到EoS信號(hào)的“提前規(guī)劃”,這些隱藏的現(xiàn)象揭示了模型長(zhǎng)度指令遵循能力的深層次不足。不過,通過擴(kuò)充預(yù)訓(xùn)練數(shù)據(jù)和引入預(yù)規(guī)劃策略,未來(lái)的模型完全有希望實(shí)現(xiàn)“字夠了,內(nèi)容也對(duì)了”。

總結(jié)

論文提出了 LIFEBENCH,用于評(píng)估大型語(yǔ)言模型(LLMs)在多種任務(wù)、語(yǔ)言和長(zhǎng)度限制下遵循長(zhǎng)度指令的能力。

分析表明,當(dāng)前 LLMs 在長(zhǎng)度指令執(zhí)行上仍存在顯著問題,尤其在長(zhǎng)文本限制下,生成長(zhǎng)度常低于聲稱的能力范圍,甚至表現(xiàn)出“提前結(jié)束””的傾向。模型表現(xiàn)還受到任務(wù)類型、語(yǔ)言和輸入長(zhǎng)度等因素的顯著影響。

這些發(fā)現(xiàn)揭示了 LLMs 在長(zhǎng)度指令遵循上的關(guān)鍵短板,表明未來(lái)需要更優(yōu)的訓(xùn)練策略,以及更全面的評(píng)估體系,來(lái)提升其對(duì)長(zhǎng)度指令的執(zhí)行能力和實(shí)際表現(xiàn)。

github倉(cāng)庫(kù):https://github.com/LIFEBench/LIFEBench

huggingface鏈接:https://huggingface.co/datasets/LIFEBench/LIFEBench

論文地址:https://arxiv.org/abs/2505.16234

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗:“友好”國(guó)家已就以色列動(dòng)武向德黑蘭發(fā)出警報(bào)

伊朗:“友好”國(guó)家已就以色列動(dòng)武向德黑蘭發(fā)出警報(bào)

參考消息
2025-06-12 20:56:18
88年女友考入清華與我分手,我戍守邊疆23年,轉(zhuǎn)業(yè)時(shí)竟意外相逢

88年女友考入清華與我分手,我戍守邊疆23年,轉(zhuǎn)業(yè)時(shí)竟意外相逢

秋風(fēng)專欄
2025-06-11 10:26:13
印度空難,最頭疼的是特朗普

印度空難,最頭疼的是特朗普

新動(dòng)察
2025-06-13 09:50:08
1天內(nèi),中方向伊以伸出橄欖枝,哈梅內(nèi)伊被打醒:梟龍戰(zhàn)機(jī)買晚了

1天內(nèi),中方向伊以伸出橄欖枝,哈梅內(nèi)伊被打醒:梟龍戰(zhàn)機(jī)買晚了

大歪歪
2025-06-13 21:21:09
穆斯卡特:中國(guó)足壇近期涌現(xiàn)出一波非常有才華的年輕球員

穆斯卡特:中國(guó)足壇近期涌現(xiàn)出一波非常有才華的年輕球員

懂球帝
2025-06-13 18:13:18
鄭欽文艱難獲勝后,今晚8進(jìn)4的比賽,將面對(duì)前美網(wǎng)冠軍拉杜卡努

鄭欽文艱難獲勝后,今晚8進(jìn)4的比賽,將面對(duì)前美網(wǎng)冠軍拉杜卡努

春序娛樂
2025-06-13 19:54:35
印度客機(jī)墜毀,一名空姐的家人翻著相冊(cè),跪地痛哭

印度客機(jī)墜毀,一名空姐的家人翻著相冊(cè),跪地痛哭

瀟湘晨報(bào)
2025-06-12 22:44:09
兩大國(guó)手或入駐NBA!央媒曝楊瀚森試訓(xùn)出色,林葳試訓(xùn)NBA排第二

兩大國(guó)手或入駐NBA!央媒曝楊瀚森試訓(xùn)出色,林葳試訓(xùn)NBA排第二

傲傲講歷史
2025-06-13 21:58:28
一個(gè)孩子覺醒最快的方式:從吃“高級(jí)苦”開始

一個(gè)孩子覺醒最快的方式:從吃“高級(jí)苦”開始

諾媽家有男寶娃
2025-06-13 09:19:36
伊朗——戰(zhàn)略誤判的代價(jià)!

伊朗——戰(zhàn)略誤判的代價(jià)!

華山穹劍
2025-06-13 20:29:13
泰國(guó),迎來(lái)了大變局

泰國(guó),迎來(lái)了大變局

奇思妙想生活家
2025-06-12 15:19:57
峨眉山發(fā)生人猴大戰(zhàn),游客掉下山崖摔死,猴王被警察一槍擊斃

峨眉山發(fā)生人猴大戰(zhàn),游客掉下山崖摔死,猴王被警察一槍擊斃

溫情郵局
2025-06-10 16:48:22
大決戰(zhàn)來(lái)了?以色列關(guān)閉領(lǐng)空,伊朗直接甩王牌,白宮撤僑專機(jī)起飛

大決戰(zhàn)來(lái)了?以色列關(guān)閉領(lǐng)空,伊朗直接甩王牌,白宮撤僑專機(jī)起飛

影孖看世界
2025-06-13 21:14:35
阿斯:意足協(xié)已了解貝尼特斯帶隊(duì)意愿,但更傾向于06冠軍成員

阿斯:意足協(xié)已了解貝尼特斯帶隊(duì)意愿,但更傾向于06冠軍成員

懂球帝
2025-06-13 10:39:22
一邊要稀土一邊發(fā)難?印度部長(zhǎng)稱中國(guó)“不可信”,中方冷處理應(yīng)對(duì)

一邊要稀土一邊發(fā)難?印度部長(zhǎng)稱中國(guó)“不可信”,中方冷處理應(yīng)對(duì)

娛樂的宅急便
2025-06-13 21:24:09
魔術(shù)師約翰遜喊話東契奇:我們不該提醒你保持體型,你早該自覺做到

魔術(shù)師約翰遜喊話東契奇:我們不該提醒你保持體型,你早該自覺做到

雷速體育
2025-06-13 11:20:29
普京:俄將組建無(wú)人系統(tǒng)部隊(duì)

普京:俄將組建無(wú)人系統(tǒng)部隊(duì)

新京報(bào)
2025-06-13 08:02:03
核設(shè)施被以色列炸了!伊朗宣布關(guān)閉領(lǐng)空,兩位核科學(xué)家遇襲身亡

核設(shè)施被以色列炸了!伊朗宣布關(guān)閉領(lǐng)空,兩位核科學(xué)家遇襲身亡

21世紀(jì)經(jīng)濟(jì)報(bào)道
2025-06-13 11:49:11
農(nóng)村養(yǎng)老費(fèi)共63元,每月領(lǐng)0.5元,社保局:一次發(fā)完無(wú)法保障養(yǎng)老

農(nóng)村養(yǎng)老費(fèi)共63元,每月領(lǐng)0.5元,社保局:一次發(fā)完無(wú)法保障養(yǎng)老

漁夫說(shuō)事
2025-06-12 12:50:03
DeepSeek:未來(lái)10年,中國(guó)壓力最大的8個(gè)職業(yè),中小學(xué)教師非首位

DeepSeek:未來(lái)10年,中國(guó)壓力最大的8個(gè)職業(yè),中小學(xué)教師非首位

市井覓食記
2025-02-26 00:20:55
2025-06-13 22:43:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10659文章數(shù) 176166關(guān)注度
往期回顧 全部

科技要聞

報(bào)志愿非得花上萬(wàn)元找"張雪峰"?AI行不行

頭條要聞

以軍發(fā)動(dòng)襲擊前 內(nèi)塔尼亞胡到哭墻塞了一張紙條

頭條要聞

以軍發(fā)動(dòng)襲擊前 內(nèi)塔尼亞胡到哭墻塞了一張紙條

體育要聞

世界第一和他背后的智囊

娛樂要聞

宋茜壓軸風(fēng)波升級(jí)!官方下場(chǎng)暗示順序

財(cái)經(jīng)要聞

5月M2同增7.9% 前5個(gè)月存款增14.73萬(wàn)億

汽車要聞

長(zhǎng)城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

家居
房產(chǎn)
健康
藝術(shù)
軍事航空

家居要聞

森林幾何 極簡(jiǎn)灰調(diào)原木風(fēng)

房產(chǎn)要聞

18位頂級(jí)買家瘋搶!凱旋新世界,憑何成為廣州頂豪終極價(jià)值錨點(diǎn)?

呼吸科專家破解呼吸道九大謠言!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

伊朗多名將領(lǐng)、核科學(xué)家遇襲身亡 身份披露

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 99国产欧美久久久精品蜜芽| 国产熟女一区二区三区四区五区| 欧美丰满熟妇乱xxxxx视频| 久久久久成人精品无码中文字幕| 欧美熟妇另类久久久久久多毛| 欧美人与动另类xxxx| 久久久久亚洲av无码专区首| 欧美疯狂做受xxxxx高潮| 欧洲国产精品无码专区影院| 国产精品午夜不卡片在线| 国产麻豆成人传媒免费观看| 久久天天躁狠狠躁夜夜躁app| 成人av无码一区二区三区| 鲁丝一区二区三区免费| 人妻系列无码专区无码中出| 亚洲高清无码视频网站在线| 色播久久人人爽人人爽人人片av| 狠狠色噜噜狠狠狠狠2021| 免费无码又爽又刺激网站直播| 绝顶高潮合集videos| 婷婷色爱区综合五月激情韩国| 久久天堂av综合合色| 秋霞无码久久久精品交换| 亚洲综合一区国产精品| 中国亚州女人69内射少妇| 欧美一区二区| 精品少妇人妻av一区二区三区| 国产精品久久久久久免费软件| 无码人妻一区二区三区在线| 成人免费视频一区二区| 久久99日韩国产精品久久99| 精品一区二区三人妻视频| 欧美性猛交久久久乱大交小说| 日日碰狠狠添天天爽不卡| 开心久久婷婷综合中文字幕| 免费a级毛片| 5d肉蒲团之性战奶水| 三上悠亚福利一区二区| 日韩精品无码一区二区忘忧草| 国产极品粉嫩福利姬萌白酱| 国产亚洲人成网站观看|