大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

最大的開源GraphRag:知識圖譜完全自主構建|港科大&華為

0
分享至

AutoSchemaKG團隊 投稿
量子位 | 公眾號 QbitAI

知識圖譜(KGs)已經可以很好地將海量的復雜信息整理成結構化的、機器可讀的知識,但目前的構建方法仍需要由領域專家預先創建模式,這限制了KGs的可擴展性、適應性和領域覆蓋范圍。

為此,香港科技大學KnowComp實驗室聯合香港華為理論部提出了AutoSchemaKG:一個無需預定義模式、用于完全自主知識圖譜構建的框架。

該系統利用大型語言模型,可以直接從文本中同時提取知識三元組并歸納出全面的模式,對實體和事件進行建模,同時采用概念化方法將實例組織成語義類別。

實驗證實,該模式歸納在零人工干預的情況下,與人類設計的模式達到了95%的語義對齊。

另外,通過處理超過5000萬份文檔,AutoSchemaKG團隊還構建了ATLAS(自動三元組鏈接與模式歸納):一個包含超過9億節點和59億邊的知識圖譜系列。



論文第一作者白佳欣是香港科技大學計算機科學與工程系的博士后研究員,受香港研究資助局新晉學者計劃(JRFS)獎項資助。

白博士的研究重點在于圖神經數據庫系統構建,大規模知識圖譜構建和推理,檢索增強生成等。他在ACL、NeurIPS、KDD等頂級會議發表了多篇論文,工作涵蓋電子商務意圖建模、復雜查詢回答和隱私保護神經圖數據庫等前沿領域。

創新:驅動模式歸納的概念化過程



上圖展示的是ATLAS的結構,實體節點(藍色)和事件節點(綠色)從文本中提取,而概念節點(橙色)則通過模式歸納獲得。

AutoSchemaKG利用大型語言模型的語義理解能力,能夠直接從文本中同時提取知識三元組并動態歸納模式,將特定的實體、事件和關系泛化為更廣泛的概念類別。

這種概念化具有多種關鍵功能:它在看似無關的信息之間建立語義橋梁,支持跨領域的零樣本推理,減少知識圖譜中的稀疏性,并提供支持具體和抽象推理的層級組織。

該框架將事件與實體一同建模,認識到現實世界的知識是動態而非靜態的;通過將事件視為語義基元,可以捕捉到僅有實體的圖譜所忽略的時間關系、因果關系和過程性知識。

像這樣將傳統的靜態模式轉變為一個動態的、多層次的概念框架,能夠適應新領域而無需預定義本體。

構建:完全自動化知識圖譜

三元組提取

AutoSchemaKG采用一個多階段流水線,使用大型語言模型將Dolma語料庫中的非結構化文本轉換為知識三元組。該流水線通過三個連續階段提取實體-實體、實體-事件和事件-事件關系:

階段1:使用系統提示提取實體-實體關系,該提示指示大型語言模型檢測實體及其相互關系。輸出被解析為三元組(e(1),r,e(2)),其中e(1),e(2)∈V(N)是實體節點,r∈R是關系類型。

階段2:使用提示識別實體-事件關系,生成三元組(e,r,v)或(v,r,e),其中e∈V(N),v∈V(E),r∈R。

階段3:針對事件-事件關系,使用提示生成三元組(v(1),r,v(2)),其中v(1),v(2)∈V(E),r∈R。該流水線支持各種大型語言模型,并具有優化的精度設置和GPU加速。

提取的三元組及其對應的文本和元數據被序列化為JSON文件。

模式歸納

在三元組提取之后,AutoSchemaKG會再進行模式歸納,將特定的實體、事件和關系抽象為通用的類型。

這個過程使用大型語言模型為每個圖元素生成代表其類型的概念短語,這與該形式化定義G=(V,E,C,?,ψ)相符。

對于每個類別(事件、實體和關系),分批處理元素,大型語言模型為每個元素生成至少三個短語,這些短語在不同抽象層次上概括了其類型或相關概念。

對于實體(e∈V(N)),通過整合來自鄰近節點的上下文信息來增強抽象。最多采樣N(ctx)個鄰居來構建一個提供額外語義線索的上下文字符串。

模式歸納流水線處理從三元組提取階段序列化出來的圖,元素被劃分為批次,并可選擇切片以進行分布式計算。

生成的短語記錄在一個CSV文件中,通過?和ψ將每個節點v∈V和關系r∈R映射到C中的一個概念子集。

這種自動化的模式增強了知識圖譜在不同領域間的適應性,無需人工策劃。

實踐:ATLAS系列知識圖譜的構建



語料庫的選擇上,如表所示,ATLAS-Wiki、ATLAS-Pes2o和ATLAS-CC分別由Dolma的維基百科與維基教科書子集、Semantic Scholar子集和Dolma的CC子集構建。

使用完整的維基百科與維基教科書來構建ATLAS-Wiki,使用Semantic Scholar的摘要部分來構建ATLAS-Pes2o,并使用cc-head、cc-middle和cc-tail各3%的數據來構建ATLAS-CC。

Dolma數據集中的CC的頭部、中部和尾部分類是用于衡量與維基百科文本的分布相似性。

計算成本上,使用配備80GB顯存、具有1,513TFLOPS FP16計算能力的GPU,并運行帶有Flash Attention的Llama-3-8B-instruct來構建該知識圖譜。

計算需求巨大:En-Wiki(2.439億節點,14.9億邊)需要14,300GPU小時;Pes2o-Abstract(1.744億節點,11.5億邊)需要11,800GPU小時;Common Crawl(9.373億節點,59.6億邊)需要52,300GPU小時。

以批次方式處理1024-token的文本塊,總共投入了約78,400GPU小時來提取數十億的語義關系。

測試:準確、連貫、通用

評估三元組提取準確性

使用一種嚴格的基于計數的評估方法,不依賴主觀評分,而是使用DeepSeek-V3作為評判者進行結構化驗證。

這種方法使能夠計算精確的指標:

  • 精確率:正確提取的三元組占所有提取三元組的比例;
  • 召回率:正確提取的三元組占文本中所有真實三元組的比例;
  • F1分數:精確率和召回率的調和平均值。



可以看出,AutoSchemaKG在所有數據集上都表現出卓越的提取質量,尤其是在維基百科內容上表現強勁。在大多數情況下,知識圖譜中三元組的精確率、召回率和F1分數都超過了90%,證明了提取的三元組具有高質量和高可靠性。

衡量知識圖譜中的信息保留度

測試AutoSchemaKG將原始段落轉換為知識圖譜數據后,多項選擇題(MCQ)的性能保留情況,遵循現有工作的評估協議,為每個原始段落使用LLaMA-3-70B-Instruct生成五個多項選擇題,為每個數據集采樣了200個原始段落,共獲得1,000個多項選擇題。

讓大型語言模型在沒有上下文的情況下回答這些問題(記為下限),然后再次提供原始段落回答(記為上限)以進行健全性檢查。最后,使用實體級三元組(記為實體)、事件級三元組(記為事件)以及實體級和事件級三元組的組合(記為事件+實體)進行測試。



根據結果,得出以下見解:

(1)信息在構建的知識圖譜中得到了很好的保留。使用實體、事件或事件+實體的多項選擇題性能遠高于下限基線,并接近原始段落的上限。這表明原始段落中的信息在AutoSchemaKG構建的知識圖譜中得到了很好的保留;

(2)事件比實體更有效。使用事件或事件+實體的多項選擇題性能比僅使用實體的性能更接近上限,在大多數情況下準確率超過95%。這表明事件級三元組可以比實體級三元組保留更豐富、更精確的信息。

衡量模式質量

為了展示AutoSchemaKG歸納方法的能力,將其應用于實體、事件和關系類型化任務,衡量該方法可以召回多少類型。

由于基于規則的評估可能會忽略語義相似性,使用了兩個語義級別的指標:基于BERTScore的recall和coverage(BS-R和BS-C)。



結合三種大小的LLaMA-3的使用結果,可以看出,在大多數情況下,AutoSchemaKG在實體、事件和關系類型上的召回率超過80%,通常達到90%,并且隨著大型語言模型參數規模的增加而性能提升。

在多跳問答任務上的性能

選擇了MuSiQue、HotpotQA和2WikiMultihopQA三個以多跳推理需求著稱的基準數據集,這些任務需要跨文章的復雜關系路徑。從每個數據集中隨機選擇一千個問題。

將基于知識圖譜的RAG系統與幾種最先進的方法進行比較:基于圖的基線包括HippoRAG、HippoRAG2、GraphRAG、LightRAG以及MiniRAG。對于基于文本的RAG比較,評估了BM25+LLM(使用傳統BM25評分進行檢索)、Contriever以及RAPTOR。

使用開放領域問答的標準指標來評估AutoSchemaKG。精確匹配(EM)在歸一化后衡量二元正確性。F1分數衡量歸一化答案之間的詞元重疊度。



實驗結果表明,AutoSchemaKG在三個基準數據集的多跳問答中表現出色。

與HippoRAG2集成后,Full-KG配置(實體、事件和概念)的性能比BM25和Contriever等傳統檢索方法高出12-18%,凸顯了其在復雜推理場景中的優勢。

另外,與需要LLaMA-3.3-70B-Instruct進行構建和問答閱讀的原始HippoRAG2實現相比,AutoSchemaKG使用LLaMA-3.1-8B-Instruct作為圖構建器取得了相當或更好的結果。

在增強事實性方面的有效性

遵循FELM的協議,對三個領域(世界知識、科學/技術和寫作/推薦)應用RAG,同時對數學和推理領域保持原始設置。

為了進行全面比較,評估了多種檢索方法:HippoRAGv2、BM25和使用MiniLM的密集檢索。

所有實驗都使用相同的LLaMA-3.1-8B-Instruct模型,并集成了Neo4j和零樣本CoT設置,以確保方法間的公平比較。性能使用平衡準確率(對真假片段給予同等權重)和檢測事實錯誤的F1分數來衡量。



結果表明,使用AutoSchemaKG的HippoRAG2在維基百科(56.43%準確率,30.48%F1)和Common Crawl語料庫上持續優于基線,同時在Pes2o-Abstract上取得了有競爭力的結果。在維基百科上的優越性能可能源于FELM部分樣本以維基百科為參考。

通用領域知識能力

使用與FELM實驗相同的檢索和生成設置,將MMLU任務分類為主體類別,并專注于知識密集型領域,包括歷史、法律、宗教、哲學/倫理、醫學/健康、全球事實和社會科學。



結果表明,ATLAS知識圖譜在所有測試語料庫的這些領域中都提升了性能。

每個ATLAS變體都展示了獨特的優勢:ATLAS-Pes2o在醫學/健康和社會科學領域表現出色,反映了其源自學術論文的知識;ATLAS-Wiki在宗教、哲學/倫理和全球事實等一般知識領域顯示出優勢;而ATLAS-CC在法律和歷史方面表現最佳,利用了其更廣泛的網絡來源內容。

在這些人文學科和社會科學領域,所有ATLAS變體都持續優于無檢索基線和Freebase-ToG。例如,在法律領域,該方法比基線提高了4個百分點,而其他一些檢索方法實際上降低了性能。

領域特定的性能模式符合直觀預期:知識圖譜在檢索對人文學科和社會科學至關重要的事實關系方面表現出色,而在數學和技術領域,節點-關系結構在捕捉過程性知識方面效果有限,因此優勢有限。

論文鏈接:https://arxiv.org/abs/2505.23628

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《紐約時報》:特朗普對中國玩過頭了,中國證明其處在強大的地位

《紐約時報》:特朗普對中國玩過頭了,中國證明其處在強大的地位

小鬼頭體育
2025-06-14 16:29:19
阿西莫娃2-1鄭欽文,賽后媒體:熟悉的配方,賽會第一輸得不冤

阿西莫娃2-1鄭欽文,賽后媒體:熟悉的配方,賽會第一輸得不冤

阿覽
2025-06-15 01:53:33
10歲男孩竟在臺風天,獨自一人在海上劃槳板漂流5小時,目前已獲救上岸回家

10歲男孩竟在臺風天,獨自一人在海上劃槳板漂流5小時,目前已獲救上岸回家

魯中晨報
2025-06-14 16:10:13
印度空難有新說法?機長生前留下3字,消息一出,美不許停飛波音

印度空難有新說法?機長生前留下3字,消息一出,美不許停飛波音

嘆知
2025-06-14 21:53:14
梁植誠任廣西壯族自治區紀委監委駐自治區發改委紀檢監察組組長

梁植誠任廣西壯族自治區紀委監委駐自治區發改委紀檢監察組組長

汲古知新
2025-06-15 01:55:04
6月14日俄烏:美反對G7降低俄石油上限,俄軍戰機擊落自家飛機

6月14日俄烏:美反對G7降低俄石油上限,俄軍戰機擊落自家飛機

山河路口
2025-06-14 18:19:12
蘭州一地突發塌陷,天然氣管道受損

蘭州一地突發塌陷,天然氣管道受損

澎湃新聞
2025-06-15 00:28:09
明明自己半瓶水,這幾位還“冒充”歌手開演唱會,難怪被官媒點名

明明自己半瓶水,這幾位還“冒充”歌手開演唱會,難怪被官媒點名

溫讀史
2025-06-12 14:19:44
風仍在吹:內伊說要終結以色列政權,但結果即便神權保住也···

風仍在吹:內伊說要終結以色列政權,但結果即便神權保住也···

邵旭峰域
2025-06-14 12:12:16
F-35被伊朗擊落!女飛行員跳傘后被活捉,以色列淪為第二個印度

F-35被伊朗擊落!女飛行員跳傘后被活捉,以色列淪為第二個印度

大道無形我有型
2025-06-14 11:30:28
30歲男子相親相到初中的班花,自卑得轉身就走:我哪里配得上她

30歲男子相親相到初中的班花,自卑得轉身就走:我哪里配得上她

唐小糖說情感
2025-06-12 08:54:25
視頻丨伊朗開始對以色列發動新一輪導彈襲擊

視頻丨伊朗開始對以色列發動新一輪導彈襲擊

環球網資訊
2025-06-15 07:15:04
上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

懸案解密檔案
2025-05-09 18:00:29
以軍稱空襲伊朗國防部總部、核計劃總部及多處石油設施

以軍稱空襲伊朗國防部總部、核計劃總部及多處石油設施

新京報
2025-06-15 07:38:03
巴鐵空軍馳援伊朗,殲-10C掛霹靂-15迎戰F-35?

巴鐵空軍馳援伊朗,殲-10C掛霹靂-15迎戰F-35?

頭條爆料007
2025-06-14 15:21:04
原三鎮股東:因股改階段個別記者不實報道,集團決心退出足球

原三鎮股東:因股改階段個別記者不實報道,集團決心退出足球

懂球帝
2025-06-14 18:09:17
兢兢業業的利物浦老臣,即將告別安菲爾德:為科爾克茲轉會讓路

兢兢業業的利物浦老臣,即將告別安菲爾德:為科爾克茲轉會讓路

里芃芃體育
2025-06-15 08:14:44
街頭的烤鴨能不能吃,為何比活鴨價格便宜這么多?愛吃的快看

街頭的烤鴨能不能吃,為何比活鴨價格便宜這么多?愛吃的快看

農夫也瘋狂
2025-06-10 11:21:09
妥妥的黑店!22歲帝星開口就要1億歐,3家英超豪門恐直接被嚇退

妥妥的黑店!22歲帝星開口就要1億歐,3家英超豪門恐直接被嚇退

零度眼看球
2025-06-15 07:22:47
江西16歲女生約房東在賓館見面,4小時后將其扔進臭水溝

江西16歲女生約房東在賓館見面,4小時后將其扔進臭水溝

風到腰彎
2025-06-13 22:00:22
2025-06-15 08:32:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10666文章數 176167關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

伊朗數小時內或再襲擊 以色列進入"前所未有緊急狀態"

頭條要聞

伊朗數小時內或再襲擊 以色列進入"前所未有緊急狀態"

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個生日沒大S陪伴

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

家居
教育
旅游
房產
軍事航空

家居要聞

森林幾何 極簡灰調原木風

教育要聞

分數之外,孝道滿分:一場高考后的溫情禮贊

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

軍事要聞

伊媒:以色列國防部大樓被伊朗導彈擊中

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产无套露脸在线观看| 久久av免费这里有精品| 久久99er精品国产首页| 午夜a理论片在线播放| 特级精品毛片免费观看| 日韩乱码人妻无码中文字幕视频| 久久精品一卡二卡三卡四卡| 国产亚洲美女精品久久久| 免费看av在线网站网址| 国产探花在线精品一区二区| 97久久精品午夜一区二区| 亚洲精品久久久无码av片软件| 亚洲欧美人成网站aaa| 国产精品疯狂输出jk草莓视频| 亚洲女线av影视宅男宅女天堂| 99精品国产一区二区三区| 丰满人妻中伦妇伦精品app| 成人亚洲一区二区三区在线| 午夜乱人伦精品视频在线| 国产成人无码牲交免费视频| 亚洲一二区制服无码中字| 成人精品视频一区二区不卡| 亚洲色欲久久久久综合网| 免费a级毛片无码a∨免费软件| 亚洲另类激情专区小说| 精品久久久无码人妻中文字幕豆芽| 永久免费观看国产裸体美女| 成人18禁深夜福利网站app免费| 麻豆亚洲av成人无码久久精品| 国产精品视频免费一区二区| 男人女人午夜视频免费| 亚洲日本乱码中文在线电影| 亚洲午夜精品a片久久www慈禧| 欧美综合人人做人人爱| 无码人妻精品一区二区三区久久| 性欧美老人牲交xxxxx视频| 色欲久久人妻内射| 国产精品成人观看视频| 特级毛片内射www无码| 中国老太婆bb无套内射| 精品第一国产综合精品蜜芽|