來源:有道AI情報局
自2022年11月30日ChatGPT問世,大語言模型在全球掀起熱潮,眾多高校、科研機構及AI企業紛紛投身其中,探索其在各行業的應用潛力與創新模式。
作為國內機器翻譯領域深耕多年的技術團隊,我們曾率先成功推出統計機器翻譯及神經網絡機器翻譯服務,并持續迭代。
- 憑借豐富的業務生態與深厚的技術積累,2023年伊始,有道迅速開啟以“應用落地” 為導向的翻譯大模型自研之路。
- 經過持續的技術攻關和優化迭代,2023年6月,“子曰翻譯大模型1.0”正式推出;
- 2024年5月,實現“子曰翻譯大模型1.5”上線部署,至今已過去七個月。期間有道翻譯的用戶們積極使用我們的服務,并且慷慨地分享了眾多極具價值的反饋與建議。
如今,子曰翻譯大模型2.0已正式與大家見面,這象征著我們在語言翻譯技術的征途上又邁出了堅實而重要的一步,相信能夠為我們的用戶帶來更加出色的翻譯體驗。
從1.5到2.0, 質的飛躍
整體性能上,子曰翻譯大模型 2.0相較于1.5版本實現了質的飛躍。這背后,是我們從數據、算法以及評估三個關鍵維度所展開的深入探索與系統性升級。
在數據層面,為訓練面向翻譯任務的基座模型,我們精心收集了并嚴格清洗了數千萬高質量的翻譯數據。不僅確保了數據的準確性與適配性,為模型訓練打下了牢固的根基,更極大地豐富了數據資源庫,讓模型在多樣化翻譯場景中游刃有余。此外,我們基于海量的翻譯提示進行了精細化的人工標注,有效地提升了數據標注的質量,為模型執行翻譯任務提供了精準的指導。
在算法層面,以子曰教育大模型為基礎,我們進行了二次預訓練,成功打造出了更具專業性與針對性的翻譯基座大模型,顯著提升了翻譯性能。這其中,我們運用了先進的大模型蒸餾技術,讓模型在精簡參數的同時,運行效率與推理速度大幅提升;創新性地使用了大模型融合技術,將多個模型優勢進行整合,進一步增強了翻譯的準確性與穩定性;我們還實現了基于人類偏好的翻譯數據自動獲取,并以此進行強化學習;通過引入Online DPO技術,動態調整模型生成策略,保證了譯文的質量與流暢度的提升。此外,多任務聯合學習的開展,讓模型能夠在多個翻譯任務中協同進步,綜合翻譯能力得到了顯著增強。
在評估層面,我們人工標注了覆蓋各個領域的開發集和盲測集,嚴格確保了測試數據的全面性和代表性。我們對算法團隊所使用的開發集和盲測數據集實行嚴格分離、相互獨立,以確保評估的客觀性與準確性,模型最終效果以盲測集效果為準。在自動指標評估上,除了基于comet的自動化指標,我們還自主訓練了超越comet準確率的基于大模型的翻譯評估模型,為性能評估提供更可靠依據。同時,我們設計并執行了更完善的人工評估方案,從多維度對模型的翻譯結果進行細致地分析和評價。
正是通過這三個層面的全方位優化與升級,子曰翻譯大模型2.0在翻譯質量、效率以及魯棒性等方面實現了質的飛躍,能夠為用戶帶來更優質、精準的翻譯服務。
性能遠超國內外通用大模型及專用翻譯模型
為了展示子曰翻譯大模型 2.0 的性能,我們在WMT以及Flores200的測試集上進行了中英互譯的基準測試。
(采用測試集測試的結果)
為精準、客觀地評估子曰翻譯大模型2.0中英互譯能力在行業中的表現,我們與多個國內外領先通用大模型及專業翻譯器如DeepL Pro,進行了人工評估對比。
通過嚴謹的人工采集流程,我們構建了涵蓋人文學科、商學、生活服務、醫療、科學等多個領域的數據樣本集,并制定了全面精細的MQM評測方案,從專業性、準確性、語言慣例和風格等維度打分。
最終,五位資深翻譯專家獨立評估的結果匯總如下:
以上對比,凸顯了子曰翻譯大模型2.0在專有閉源模型中的競爭優勢——在翻譯準確性和流暢度上,遠優于國內外通用大模型及專用翻譯模型
該測試不僅客觀地呈現了我們的優勢,也精準地指明了未來有待優化和改進的方向,堅定了我們在機器翻譯領域持續推進改進與創新的決心。
但我們深知仍面臨諸多挑戰,在后續的工作中,我們將全力去推進支持更長文本輸入、拓展更多模態的輸入,以及增加更多語種的支持工作,我們期待在不久之后下一代子曰翻譯大模型能跟大家見面。
在此歡迎各位持續關注更多有道AI技術的進展與突破,也誠邀大家前來體驗“子曰翻譯大模型 2.0”,期待您的反饋。
附:可體驗入口
1、有道詞典APP-首頁入口
2、有道翻譯桌面版-首頁入口
3、有道翻譯網頁端-AI翻譯入口
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.