大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

斯坦福團(tuán)隊(duì)開(kāi)發(fā)AI數(shù)據(jù)提取框架,為能源領(lǐng)域數(shù)據(jù)獲取難題提供方案

0
分享至

溫室氣體排放的準(zhǔn)確評(píng)估與減排是能源領(lǐng)域的重大挑戰(zhàn),但石油和天然氣行業(yè)的關(guān)鍵數(shù)據(jù)通常分散在昂貴的商業(yè)數(shù)據(jù)庫(kù)中,其存在數(shù)據(jù)碎片化、雜亂且難以獲取的問(wèn)題。此外,該領(lǐng)域的官方數(shù)據(jù)更新相對(duì)滯后,傳統(tǒng)人工提取方法效率低下且容易出錯(cuò)。

針對(duì)上述問(wèn)題,美國(guó)斯坦福大學(xué)博士生陳震林及其所在課題組基于大語(yǔ)言模型開(kāi)發(fā)了一種創(chuàng)新的框架。

該技術(shù)利用大模型(GPT-4 和 GPT-4o)卓越的文本理解能力(遠(yuǎn)超傳統(tǒng)文字識(shí)別技術(shù)),能夠從石油天然氣領(lǐng)域的公開(kāi)文獻(xiàn)(包括學(xué)術(shù)期刊論文和新聞報(bào)道等多元數(shù)據(jù)格式)中高效提取關(guān)鍵數(shù)據(jù)。

這一框架展現(xiàn)出兩大核心優(yōu)勢(shì):

一是經(jīng)濟(jì)性顯著提升,通過(guò)優(yōu)化 GPT-4o 的應(yīng)用,使單數(shù)據(jù)點(diǎn)提取成本降低達(dá) 10 倍(0.04 美元);

二是效率高,在測(cè)試數(shù)據(jù)集上實(shí)現(xiàn)了 83.74% 的準(zhǔn)確率與 78.16% 的 F1 分?jǐn)?shù),證明了其在在內(nèi)的多源信息中的適應(yīng)性與可靠性。

據(jù)介紹,這是斯坦福團(tuán)隊(duì)首例在石油天然氣領(lǐng)域的應(yīng)用。該工具不僅解決了傳統(tǒng)數(shù)據(jù)獲取的難題,更能為溫室氣體排放的精準(zhǔn)評(píng)估和全生命周期分析提供可靠支撐,最終服務(wù)于科學(xué)政策制定和環(huán)境管理決策的優(yōu)化。


圖丨陳震林(來(lái)源:陳震林)

日前,相關(guān)論文以《通過(guò)大語(yǔ)言模型數(shù)據(jù)提取推進(jìn)油氣排放評(píng)估》(Advancing oil and gas emissions assessment through large language model data extraction)為題發(fā)表在Energy and AI[1]。斯坦福大學(xué)博士生陳震林擔(dān)任第一作者兼通訊作者。


圖丨相關(guān)論文(來(lái)源:Energy and AI)

該框架的創(chuàng)新之處在于利用 GPT-4 和 GPT-4o 等大模型,通過(guò)迭代優(yōu)化提示詞(prompt engineering)實(shí)現(xiàn)油氣行業(yè)關(guān)鍵數(shù)據(jù)的高效提取。

為驗(yàn)證方法的有效性,該課題組首先構(gòu)建了一個(gè)包含 108 份文檔的專業(yè)數(shù)據(jù)集,涵蓋氣油比、水油比等 51 個(gè)核心參數(shù),并采用領(lǐng)域?qū)<胰斯?biāo)注的方式建立基準(zhǔn)數(shù)據(jù)以提升模型準(zhǔn)確率。


(來(lái)源:Energy and AI)

陳震林對(duì) DeepTech 進(jìn)一步解釋道:“我們整合了領(lǐng)域?qū)I(yè)知識(shí)與數(shù)值計(jì)算方法,包括物理方程和熱力學(xué)方程的運(yùn)用。然后,將專家計(jì)算結(jié)果與大模型輸出進(jìn)行多輪比對(duì)和迭代優(yōu)化。”

隨后,研究人員進(jìn)一步進(jìn)行微調(diào),分析每篇文章在數(shù)據(jù)庫(kù)中提取出錯(cuò)以及與人工標(biāo)注結(jié)果不符的原因。

細(xì)致的誤差分析結(jié)果顯示,數(shù)據(jù)偏差可能來(lái)自兩個(gè)方面:一方面,人工標(biāo)注本身存在誤差,在某些情況下大模型的判斷反而更準(zhǔn)確;另一方面,模型在單位換算或數(shù)值處理時(shí)會(huì)出現(xiàn)混淆。

針對(duì)這些問(wèn)題,研究人員對(duì)其進(jìn)行更多的訓(xùn)練和校正,使訓(xùn)練后的準(zhǔn)確率從初始的 63.6% 顯著提升到了 83.74%(如下表)。


表丨提示迭代訓(xùn)練結(jié)果(來(lái)源:Energy and AI)

從文檔處理效率方面來(lái)看,使用新方法從 32 篇文檔中提取大量數(shù)據(jù)僅需 61.41 分鐘,處理一個(gè)文檔平均僅需 7.09 秒,較手動(dòng)方法實(shí)現(xiàn)了顯著提升。

值得注意的是,研究還揭示了文本類型對(duì)提取效率的影響——由于字段結(jié)構(gòu)更簡(jiǎn)單、內(nèi)容更直白,新聞?lì)愇恼碌奶崛∷俣让黠@優(yōu)于技術(shù)文獻(xiàn)。

陳震林指出,研究過(guò)程中的關(guān)鍵挑戰(zhàn)在于開(kāi)發(fā)最優(yōu)的零樣本學(xué)習(xí)方法,這需要通過(guò)對(duì)提示策略的持續(xù)迭代來(lái)尋找最佳解決方案。


(來(lái)源:Energy and AI)

該課題組不僅建立了一套系統(tǒng)的提示優(yōu)化方法論,更探索出充分發(fā)揮大模型潛力的技術(shù)路徑,為能源領(lǐng)域數(shù)據(jù)提取提供了可復(fù)用的研究范式。

需要了解的是,該框架的應(yīng)用范圍不僅限于能源行業(yè)的上游領(lǐng)域,其強(qiáng)大的適應(yīng)性使其同樣適用于中游和下游環(huán)節(jié)的數(shù)據(jù)提取任務(wù)。例如,在發(fā)電領(lǐng)域,該技術(shù)可高效處理能源監(jiān)管機(jī)構(gòu)發(fā)布的年度發(fā)電站報(bào)告,以及各國(guó)政府定期發(fā)布的能源統(tǒng)計(jì)報(bào)告。

這些報(bào)告數(shù)據(jù)來(lái)源多樣,既包含傳統(tǒng)油氣領(lǐng)域信息,也涵蓋下游發(fā)電產(chǎn)業(yè)(如數(shù)據(jù)中心運(yùn)營(yíng)數(shù)據(jù))和各類結(jié)構(gòu)化表格數(shù)據(jù)。

對(duì)此,陳震林特別強(qiáng)調(diào):“我們致力于開(kāi)發(fā)具備遷移學(xué)習(xí)能力的框架體系,使其能夠通過(guò)'舉一反三'的機(jī)制,在不同應(yīng)用場(chǎng)景中創(chuàng)造新的價(jià)值。”


(來(lái)源:Energy and AI)

在未來(lái)的研究階段,研究人員計(jì)劃繼續(xù)優(yōu)化準(zhǔn)確率和架構(gòu)。陳震林表示:“我們當(dāng)初在做這項(xiàng)研究時(shí)只能依賴 GPT,但現(xiàn)在隨著大模型的不斷迭代和發(fā)展,可以讓包括 DeepSeek 在內(nèi)的多個(gè)模型混合共同閱讀文獻(xiàn)并交叉驗(yàn)證,從而進(jìn)一步提升模型的可靠性。”

目前,該團(tuán)隊(duì)的龍文男博士已完成一項(xiàng)關(guān)于全球液化天然氣碳排放測(cè)算的深入研究,系統(tǒng)追蹤了從上游開(kāi)采到下游應(yīng)用的完整供應(yīng)鏈碳足跡,相關(guān)論文已進(jìn)入投稿階段。

此外,研究人員還計(jì)劃基于錯(cuò)誤分析機(jī)制,更深入地揭示大模型本身在某些方面理解錯(cuò)誤率較高的原因。“我們將通過(guò)大規(guī)模錯(cuò)誤樣本分析,精確識(shí)別模型的理解盲區(qū)和易錯(cuò)點(diǎn),這些發(fā)現(xiàn)將直接指導(dǎo)后續(xù)的模型優(yōu)化。”陳震林說(shuō)。

在應(yīng)用層面,該課題組在本次研究中已完成了上游環(huán)節(jié)的定性分析,接下來(lái)將重點(diǎn)拓展至中游和下游的全面評(píng)估。“我們期待這項(xiàng)研究能成為 AI 與能源領(lǐng)域深度結(jié)合的重要工作,為全球氣候政策的科學(xué)制定提供關(guān)鍵數(shù)據(jù)支撐。”陳震林說(shuō)。

參考資料:

1.Zhenlin Chen et al. Advancing oil and gas emissions assessment through large language model data extraction.Energy and AI(2025). https://doi.org/10.1016/j.egyai.2025.100481

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
以色列攔不住伊朗導(dǎo)彈,點(diǎn)醒中國(guó):300枚東風(fēng)26,摧毀美西太基地

以色列攔不住伊朗導(dǎo)彈,點(diǎn)醒中國(guó):300枚東風(fēng)26,摧毀美西太基地

胖福的小木屋
2025-06-14 23:43:33
霍華德芬森互毆沖突:摟脖抱摔扭打倒進(jìn)觀眾席 現(xiàn)場(chǎng)混亂都被驅(qū)逐

霍華德芬森互毆沖突:摟脖抱摔扭打倒進(jìn)觀眾席 現(xiàn)場(chǎng)混亂都被驅(qū)逐

追球者
2025-06-15 07:25:59
俄羅斯一情報(bào)部門,公開(kāi)稱中國(guó)為“敵人”,普京或要另謀出路?

俄羅斯一情報(bào)部門,公開(kāi)稱中國(guó)為“敵人”,普京或要另謀出路?

允華說(shuō)
2025-06-12 16:03:44
哈梅內(nèi)伊民心盡失,伊朗的神權(quán)獨(dú)裁該結(jié)束了

哈梅內(nèi)伊民心盡失,伊朗的神權(quán)獨(dú)裁該結(jié)束了

智慧生活筆記
2025-06-14 10:25:08
設(shè)計(jì)院被舉報(bào)使用盜版CAD,被一鍋端!

設(shè)計(jì)院被舉報(bào)使用盜版CAD,被一鍋端!

黯泉
2025-06-14 22:10:35
窮人的富養(yǎng)是帶孩子到處旅游,增長(zhǎng)了欲望;富人的富養(yǎng)竟是......

窮人的富養(yǎng)是帶孩子到處旅游,增長(zhǎng)了欲望;富人的富養(yǎng)竟是......

霹靂炮
2025-06-06 22:31:58
“嚴(yán)打盜版”焦慮中的義烏市場(chǎng):商家稱做的不是LABUBU娃衣,只是“適用于15cm玩偶”

“嚴(yán)打盜版”焦慮中的義烏市場(chǎng):商家稱做的不是LABUBU娃衣,只是“適用于15cm玩偶”

紅星新聞
2025-06-14 23:23:12
伊朗德黑蘭機(jī)場(chǎng)被炸,大批客機(jī)被毀!損失或比俄軍事基地遭襲還大

伊朗德黑蘭機(jī)場(chǎng)被炸,大批客機(jī)被毀!損失或比俄軍事基地遭襲還大

科普大世界
2025-06-14 21:37:03
啪啪打臉!買房圖便宜后悔了,深圳一樓盤業(yè)主掛“吵”字橫幅抗議

啪啪打臉!買房圖便宜后悔了,深圳一樓盤業(yè)主掛“吵”字橫幅抗議

火山詩(shī)話
2025-06-15 06:07:29
總冠軍后衛(wèi)加盟!第10個(gè)!這次真的無(wú)敵了...

總冠軍后衛(wèi)加盟!第10個(gè)!這次真的無(wú)敵了...

左右為籃
2025-06-14 11:57:17
湖北一縣政協(xié)主席任上被查!曾任紀(jì)委書記

湖北一縣政協(xié)主席任上被查!曾任紀(jì)委書記

瀟湘晨報(bào)
2025-06-15 09:52:10
兒子出國(guó)后16年沒(méi)聯(lián)系,我癌癥住院時(shí),主治醫(yī)生摘下口罩:媽

兒子出國(guó)后16年沒(méi)聯(lián)系,我癌癥住院時(shí),主治醫(yī)生摘下口罩:媽

五元講堂
2025-06-12 15:16:01
網(wǎng)傳某工程有限公司破產(chǎn)倒閉,董事長(zhǎng)敗光億萬(wàn)資產(chǎn),負(fù)債兩千萬(wàn)

網(wǎng)傳某工程有限公司破產(chǎn)倒閉,董事長(zhǎng)敗光億萬(wàn)資產(chǎn),負(fù)債兩千萬(wàn)

筆尖下的人生
2025-06-14 18:09:45
福建省紀(jì)委副書記游宇飛履新

福建省紀(jì)委副書記游宇飛履新

魯中晨報(bào)
2025-06-15 10:34:09
哈利伯頓帶隊(duì)罷賽,裁判引發(fā)雷霆主場(chǎng)爭(zhēng)議。

哈利伯頓帶隊(duì)罷賽,裁判引發(fā)雷霆主場(chǎng)爭(zhēng)議。

霸王血界
2025-06-15 11:07:54
身處異國(guó)他鄉(xiāng)的陪讀媽媽,為解決兒子青春期的困擾,竟決定這么做

身處異國(guó)他鄉(xiāng)的陪讀媽媽,為解決兒子青春期的困擾,竟決定這么做

南山青松
2025-06-11 17:01:44
43歲知名主持人金昀離世!產(chǎn)后4個(gè)月患病,閨蜜曝最后搶救細(xì)節(jié)

43歲知名主持人金昀離世!產(chǎn)后4個(gè)月患病,閨蜜曝最后搶救細(xì)節(jié)

葉公子
2025-06-14 17:25:07
俄不用打了?烏前總理爆猛料:美國(guó)已批準(zhǔn)罷免,澤連斯基結(jié)局已定

俄不用打了?烏前總理爆猛料:美國(guó)已批準(zhǔn)罷免,澤連斯基結(jié)局已定

絕對(duì)軍評(píng)
2025-06-15 08:34:49
扁擔(dān)女孩露面受訪了!面對(duì)新華社,她終于透露了一家人的經(jīng)濟(jì)來(lái)源

扁擔(dān)女孩露面受訪了!面對(duì)新華社,她終于透露了一家人的經(jīng)濟(jì)來(lái)源

青青子衿
2025-06-14 19:30:13
好消息!鐵路部門規(guī)定!60歲以上乘坐火車高鐵,可以享受這些福利

好消息!鐵路部門規(guī)定!60歲以上乘坐火車高鐵,可以享受這些福利

詩(shī)詞中國(guó)
2025-06-14 14:06:56
2025-06-15 13:43:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15294文章數(shù) 513782關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴(yán)重缺貨

頭條要聞

以色列遭伊朗近200枚彈道導(dǎo)彈襲擊 大片別墅變廢墟

頭條要聞

以色列遭伊朗近200枚彈道導(dǎo)彈襲擊 大片別墅變廢墟

體育要聞

裁判可以噴,但也從步行者自身找找問(wèn)題?

娛樂(lè)要聞

鳳凰傳奇曾毅塌房?網(wǎng)友:別連累玲花

財(cái)經(jīng)要聞

以伊沖突持續(xù)升級(jí),對(duì)全球市場(chǎng)影響多大

汽車要聞

長(zhǎng)城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

藝術(shù)
健康
教育
親子
軍事航空

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言!

教育要聞

黑龍江頂尖高分考生想報(bào)哈工大,哪些專業(yè)值得推薦?省排名多少?

親子要聞

周末天氣這么好,必須帶娃感受下大自然的氣息

軍事要聞

伊朗最高領(lǐng)袖高級(jí)顧問(wèn)沙姆哈尼 因傷勢(shì)過(guò)重離世

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美激情a∨在线视频播放| 国产av高清怡春院| 久久婷婷丁香五月综合五| 亚洲精品国产一区二区小泽玛利亚| 曰韩精品无码一区二区三区视频| 久久免费的精品国产v∧| 天天天狠天天碰天天爱| 成人国产精品日本在线观看| 精品久久久无码中文字幕| 国产精品毛片一区二区三区| 久久精品一区二区三区av| 国产女人高潮抽搐喷水免费视频| 国产免码va在线观看免费| 久久www成人_看片免费不卡| 久久久www成人免费毛片| 在线无码中文字幕一区| 成人做爰69片免费看网站| 免费特级黄毛片在线成人观看| 中文字幕丰满伦子无码| 在线播放免费人成毛片乱码| 欧美丰满熟妇bbbbbb百度| 激情毛片无码专区| 国产日产久久高清欧美一区| 香蕉久久人人爽人人爽人人片av| 亚洲精品成av人片天堂无码| 欧美精品黑人粗大视频| 亚洲色大成网站www永久| 日韩精品成人一区二区三区| 狠狠躁日日躁夜夜躁2020| 97在线视频人妻无码| 搡女人真爽免费视频大全| 国产人妻aⅴ色偷| 中文字幕人成乱码熟女香港| 国产在视频线精品视频| 日韩成人免费无码不卡视频| 国产女人18毛片水真多1| 无码一区二区三区在线观看| 免费无码无遮挡裸体视频| 色吊丝永久性观看网站| 精品综合久久久久久97| 国产亚洲精品一区二区三区|