整理 | 鄭麗媛
出品 | CSDN(ID:CSDNnews)
過去幾十年,人機(jī)交互 的方式不斷演變。從最初的鍵盤命令,到圖形界面、觸屏操作,再到語音喚醒與 自然對話,每一次變革,都在讓技術(shù)變得更“人性化”。
而現(xiàn)在,隨著大模型技術(shù)的加速發(fā)展,我們正在進(jìn)入一個全新的階段:人與機(jī)器的交流,正在從“響應(yīng)式”邁向“理解式”。不再只是聽得懂、答得上,而是能持續(xù)記住你說過的話、體會你說話的情緒、甚至主動調(diào)整回應(yīng)方式——或許,這才是真正的智能交互。
在這場變革中,作為國內(nèi) AI 領(lǐng)域的領(lǐng)跑者,科大訊飛再次走到了前沿:6 月 12 日,在一場以「交互領(lǐng)航 智啟新章」為主題的智能交互產(chǎn)品升級發(fā)布會中,科大訊飛重磅帶來了一系列最新成果。
那么接下來,就讓我們來看看在科大訊飛眼中,未來交互的新范式是怎樣的?
十年技術(shù)迭代,AIUI 開啟大模型煥新交互
正如科大訊飛開放平臺總經(jīng)理趙艷軍在發(fā)布會開場所說:
“訊飛開放平臺陪伴大家度過了 15 年,這 15 年,其實也是我們中國 AI 發(fā)展的 15 年。”
從語音識別起步,到如今布局通用 AI 大模型,訊飛開放平臺已經(jīng)在 AI 領(lǐng)域深耕 15 年:從 2010 年發(fā)布首個行業(yè)語音云,到 2015 年推出首個人機(jī)交互開放平臺 AIUI,再到 2023 年星火大模型的橫空出世,正式開啟大語言模型時代——科大訊飛始終站在 AI 發(fā)展前沿,推動著人機(jī)交互方式的持續(xù)進(jìn)化。
其中,AIUI 開放平臺以訊飛星火大模型為核心,匯聚了降噪算法、語音識別、圖像識別、數(shù)字虛擬人交互、硬件開發(fā)等全鏈路人機(jī)交互軟硬件核心能力,讓產(chǎn)品不僅能聽會說,而且能理解會思考。
如今,在大模型浪潮的推動下,訊飛開放平臺已匯聚全球生態(tài)合作伙伴超 1150 萬,近三年復(fù)合增長率超過 40%。不僅用戶數(shù)量迅速增長,其活躍度也顯著提升:與大模型發(fā)布前相比,如今 AIUI 平臺日均調(diào)用開發(fā)者數(shù)量增長了 43.8%,日均 AI 服務(wù)調(diào)用量也增長了 85.6%。
與此同時,近年來 AIUI平臺、虛擬人交互平臺在智能硬件和數(shù)字人領(lǐng)域也不斷取得突破:
● 大模型發(fā)布后,幾乎所有智能終端領(lǐng)域都實現(xiàn)了快速增長。智能硬件的交互體驗大幅升級,也讓 2025 年 AIUI 平臺上智能硬件開發(fā)者增長 31.3%,超過全量開發(fā)者增長率;
● 在數(shù)字人賽道,相比 2023 年,2024 年虛擬人創(chuàng)作數(shù)量增長了 16.6 倍,數(shù)字人每日交互次數(shù)也增長了 6.5 倍,顯示出其使用價值持續(xù)上升。
正是基于這樣的積累與沉淀,在本次發(fā)布會上,科大訊飛正式推出了全新的 AIUI 升級版本——一個面向未來的一站式人機(jī)交互開發(fā)平臺,全面支持多模態(tài)、多場景、多終端的智能交互需求。
很多人認(rèn)為大模型就是“聊天”,但實際上人機(jī)交互的需求遠(yuǎn)不止于此。除了對話,還有形如家居控制、媒體點播、車載導(dǎo)航等任務(wù),這些需求集合了工具屬性、娛樂屬性與對話屬性。因此總體而言:人機(jī)交互是一個涵蓋感知、理解、響應(yīng)與記憶的復(fù)雜系統(tǒng)性工程。
基于此,全新升級的 AIUI 平臺實現(xiàn)全鏈路交互貫穿調(diào)優(yōu):從設(shè)備端聲學(xué)處理到云端智能理解,再到內(nèi)容響應(yīng)與定制開發(fā),讓機(jī)器擁有情緒識別、創(chuàng)意生成與深度語義理解等類人多模態(tài)能力,從而生成出更加自然、有針對性的回應(yīng)。
簡單來說,新一代 AIUI 平臺使人機(jī)交互功能全面、效果優(yōu)越、安全有保障——而這一點,在面向兒童場景的交互方案上得到了充分體現(xiàn)。
“在大模型發(fā)布后,我們發(fā)現(xiàn)在每天交互時長最多的是兒童場景,兒童每天的交互時長增長了 7 倍以上,這說明兒童是真的愿意去和機(jī)器聊天。”
從 AIUI 平臺數(shù)據(jù)顯示來看,兒童用戶的交互活躍度顯著提升。然而與成人用戶相比,兒童的表達(dá)方式存在顯著差異——表達(dá)模糊、語義不明確甚至存在歧義。
為此,訊飛基于兒童語料定制優(yōu)化,訓(xùn)練出了專屬的兒童識別大模型和兒童理解大模型,以進(jìn)一步提升識別準(zhǔn)確率和語義理解能力。在對話風(fēng)格方面,也特別優(yōu)化了語氣和交互體驗,讓系統(tǒng)的回答更加有趣、友好,并具備引導(dǎo)性,從而能與孩子建立更自然的互動關(guān)系。
此外,圍繞“寓教于樂”的理念,AIUI 平臺還最新提供了豐富的兒童內(nèi)容資源,例如:
● 構(gòu)建了多個經(jīng)典兒童 IP,孩子只需一句話即可與喜歡的角色對話,極大提升其了互動意愿與參與度;
● 支持“故事共創(chuàng)”功能,孩子可以與兒童大模型共同編寫一個屬于他們的故事,甚至還能一起猜謎語、玩腦筋急轉(zhuǎn)彎等;
● 構(gòu)建了大量適用于早教的技能模塊,包括語言發(fā)展、科學(xué)啟蒙、社會認(rèn)知等方向,幫助兒童在有趣的交互過程中實現(xiàn)全面成長;
● 還接入了多個優(yōu)質(zhì)的兒童信源,包括兒童音樂、兒童故事等資源庫。
此外,訊飛表示也高度重視兒童心理健康。其兒童大模型在交互中以鼓勵和正向反饋為主,幫助孩子建立自信心。當(dāng)系統(tǒng)檢測到孩子可能存在情緒波動或心理壓力時,會進(jìn)行溫和引導(dǎo);若判斷為潛在高風(fēng)險事件(如校園沖突),AI 會嘗試引導(dǎo)孩子表達(dá)并提出建議,必要時也將通知家長介入。另外,為保障兒童內(nèi)容的安全性,AIUI 平臺中所有兒童內(nèi)容也均經(jīng)過嚴(yán)格審核,確保兒童在 AI 的陪伴下快樂成長。
趙艷軍強(qiáng)調(diào):“兒童的表達(dá)方式豐富多樣,他們也非常愿意與 AI 大模型進(jìn)行對話。但只有在真正做了產(chǎn)品之后,我們才會真正地發(fā)現(xiàn)兒童的世界是怎么樣的。”
除了兒童場景之外,此次發(fā)布會上還重點介紹了 AIUI 平臺針對智能眼鏡場景和家庭泛屏場景下的定向優(yōu)化。
其中,為了推動智能眼鏡真正走進(jìn)現(xiàn)實,訊飛正式推出三麥陣列降噪技術(shù)。
為什么是三麥呢?常規(guī)的語音降噪在技術(shù)上通過雙麥克風(fēng)即可實現(xiàn),但訊飛指出:在日常使用環(huán)境中,智能眼鏡不僅要過濾環(huán)境噪聲,還要識別佩戴者是否為當(dāng)前說話人,確保只響應(yīng)佩戴者的語音指令;同時,在面對面翻譯等場景中,還需要拾取對面說話者的聲音,實現(xiàn)雙向語義理解——因此,三麥陣列正是為了解決“只聽你說”與“聽懂別人說”的雙重任務(wù)。
在活動現(xiàn)場,訊飛還特別展示了關(guān)于智能眼鏡的多項實用功能,如食物熱量監(jiān)測、展會導(dǎo)覽講解、與國際友人的無障礙交流等,全面展現(xiàn)了 AI 賦能可穿戴設(shè)備的廣闊前景。
而在家庭應(yīng)用場景中,AIUI 平臺也圍繞影音、飲食、健康、家居等核心需求,打造了一系列實用且富有趣味性的 AI 智能體,以全面提升家庭生活的智能化程度。
“機(jī)器人超腦”全面升級,帶來機(jī)器人的“開口神器”
早在 2022 年,訊飛便推出了“機(jī)器人超腦”平臺,旨在為結(jié)構(gòu)復(fù)雜、場景多樣的機(jī)器人提供“不僅能聽會說,還能理解和執(zhí)行任務(wù)”的智能化大腦。
據(jù)訊飛官方披露,發(fā)展至今“機(jī)器人超腦”平臺已吸引超過 500 家機(jī)器人客戶接入,覆蓋人形機(jī)器人、四足機(jī)器人、輪式機(jī)器人等多種形態(tài),大多數(shù)的機(jī)器人廠商都選用了訊飛的“機(jī)器人超腦”平臺。
在此次發(fā)布會上,訊飛宣布“機(jī)器人超腦”平臺也全面升級。
首先是“多人多模態(tài)交互”能力,力求讓機(jī)器人可以識別多個說話人并實現(xiàn)多人同時交互。據(jù)介紹,在三人同時發(fā)聲的測試場景下,“機(jī)器人超腦”平臺的語音分離準(zhǔn)確率已達(dá)到 87%,語音識別準(zhǔn)確率超過 90%。
其次,考慮到實際應(yīng)用中經(jīng)常面臨斷網(wǎng)或弱網(wǎng)環(huán)境,“機(jī)器人超腦”平臺還推出了“全離線交互套件”,所有語音識別、語義理解與語音合成都可在本地端完成,為關(guān)鍵場景提供更穩(wěn)定、可靠的交互能力。
尤其值得一提的是,訊飛還帶來了一款專為無語音模組的機(jī)器人打造的“語音背包”產(chǎn)品:當(dāng)用戶購買的機(jī)器人缺乏對話能力時,只需將其安裝在機(jī)器人上,機(jī)器人就能立即擁有語音交互功能。
為了展示這款“語音背包”的互動效果,在發(fā)布會現(xiàn)場,訊飛特別選擇了其合作伙伴——宇數(shù)科技的 G1 機(jī)器人作為示范對象。
這臺已經(jīng)預(yù)裝“語音背包”的 G1 機(jī)器人,一登場便以充滿活力的語音互動打招呼,引起了現(xiàn)場觀眾的熱烈反應(yīng)。除了能夠自然進(jìn)行人機(jī)對話,它還展示了一套頗具“科技風(fēng)”的動作表演——“賽博朋克太極拳”:
不僅“身手敏捷”,它的“情商”也頗為在線。在面對“如何與女同事相處”的提問時,它也不慌不忙地“輸出秘籍”:
據(jù)介紹,這款“語音背包”內(nèi)置全鏈路交互能力,不僅能實現(xiàn)精準(zhǔn)識音,還能在復(fù)雜環(huán)境中保持高質(zhì)量的交互體驗。正如訊飛所說:“這個背包,就像是機(jī)器人的開口神器,能讓沉默的硬件秒變社交達(dá)人。”
一句話+一張圖片即可生成數(shù)字分身,移動數(shù)字人驚艷亮相
緊接著,訊飛又重點展示了其在數(shù)字人領(lǐng)域的技術(shù)進(jìn)展與平臺能力。
當(dāng)前,訊飛數(shù)字人已廣泛落地于金融、媒體、教育等多個行業(yè)領(lǐng)域,市占率穩(wěn)居第一。其技術(shù)水平也獲得權(quán)威認(rèn)可:訊飛數(shù)字人通過了中國信通院大模型數(shù)字人基礎(chǔ)能力 L5 認(rèn)證(最高等級),內(nèi)容生成能力也達(dá)到了“卓越級”。
依托于大語言模型、多模態(tài)建模等核心 AI 技術(shù),如今訊飛實現(xiàn)了“一句話、一張圖片,即可生成一個數(shù)字人分身”的能力。
在現(xiàn)場演示環(huán)節(jié)中,訊飛為觀眾完整還原了“定制一個數(shù)字人分身”的全過程:只需錄制一句簡短語音并上傳一張照片,系統(tǒng)便能迅速完成聲音復(fù)刻與形象生成。甚至,趙艷軍還讓其數(shù)字分身“小趙總”(以趙艷軍的聲音和照片為原型)親自介紹了訊飛虛擬人平臺:
據(jù)介紹,目前訊飛開放平臺已向開發(fā)者免費開放“超擬人”數(shù)字人定制服務(wù),結(jié)合 SaaS 平臺能力,可實現(xiàn)快速嵌入大屏問述、客服、導(dǎo)覽、虛擬主持、數(shù)字人直播等多樣場景。正如“小趙總”在視頻中所說:“讓虛擬人成為人類的伙伴。”隨著訊飛在 AI 驅(qū)動的語音、視覺、認(rèn)知等多模態(tài)能力上的持續(xù)突破,數(shù)字人正從“看得見的未來”變?yōu)椤坝玫闷鸬默F(xiàn)實”。
不僅如此,在本次發(fā)布會上,訊飛還推出了一款全新的移動數(shù)字人,可以做移動式的交互。現(xiàn)場演示中,移動數(shù)字人“小雨”在接收指令后,按照預(yù)設(shè)路徑自主移動至發(fā)布區(qū)域,引發(fā)觀眾連連驚嘆。
隨后,在與現(xiàn)場觀眾的互動環(huán)節(jié)中,“小雨”也展現(xiàn)出良好的人機(jī)交互體驗感。當(dāng)被問到“你和其他數(shù)字人有什么不同”時,小雨自信地介紹道:“我可以自動移動,然后在展廳里我能把產(chǎn)品故事講的生動有趣,博物館導(dǎo)覽也不在話下;我能帶您穿越時空,跟兵馬俑嘮嗑;在圖書館、商場等場所,我都可以進(jìn)行服務(wù)引導(dǎo)。”
雖然演示時間有限,但“小雨”的出場無疑成為現(xiàn)場焦點之一,這也預(yù)示著數(shù)字人形態(tài)正在從“固定交互”邁向“全場景融合”的新階段。
星辰 Agent平臺“專業(yè)版”發(fā)布,直擊企業(yè)痛點
除了以上內(nèi)容,訊飛還有另一個重要的開發(fā)平臺:訊飛星辰 Agent 平臺。
得益于近兩年來深度推理能力的不斷增強(qiáng),訊飛星火大模型在處理復(fù)雜任務(wù)、任務(wù)拆解與規(guī)劃執(zhí)行等方面展現(xiàn)了強(qiáng)大的能力,使得許多復(fù)雜的場景現(xiàn)在可以通過自動化方式解決——而星辰 Agent 平臺正是訊飛針對這一趨勢推出的一站式開發(fā)平臺,它提供了諸如 RAG、AI 插件等專業(yè)工具,旨在幫助開發(fā)者縮短應(yīng)用開發(fā)路徑。
在本次發(fā)布會上,科大訊飛正式發(fā)布了面向企業(yè)的星辰 Agent 平臺專業(yè)版。
面向企業(yè)級需求,首次發(fā)布的星辰 Agent 專業(yè)版的推出進(jìn)一步彰顯訊飛對產(chǎn)業(yè)痛點的回應(yīng)。通過擴(kuò)容資源池、強(qiáng)化高階功能,平臺為企業(yè)提供從用量保障到定制化服務(wù)的全鏈路支持。尤其在模型與 Prompt 的協(xié)同優(yōu)化上,專業(yè)版通過結(jié)構(gòu)化數(shù)據(jù)反饋與效果追蹤,將原本模糊的“經(jīng)驗主義”升級為可量化的科學(xué)流程。
在借助星辰 Agent 平臺“快速開發(fā)一個具備發(fā)票/運單信息提取能力的智能體”的演示過程中,訊飛強(qiáng)調(diào):“我們相信所有的用戶和開發(fā)者,都可以在星辰 Agent 平臺上基于自己的業(yè)務(wù)流程,去構(gòu)建一個屬于自己的 Agent 應(yīng)用。”
但在大模型加速落地的過程中,通用大模型在某些細(xì)分場景中,往往難以完全滿足企業(yè)的定制化需求。為此,訊飛推出了星辰 MaaS 平臺,為企業(yè)用戶提供從模型選擇、數(shù)據(jù)訓(xùn)練到部署運維的一站式服務(wù),幫助企業(yè)打造專屬的微調(diào)大模型。
從集成星火、DeepSeek 等多元模型,到提供國產(chǎn)化算力支撐的 99.97% 服務(wù)穩(wěn)定性,MaaS 平臺不僅降低了微調(diào)門檻,更以全生命周期管理確保模型從訓(xùn)練到推理的無縫銜接。這種“即用即銷”的自主托管模式,讓中小企業(yè)也能擁有媲美大廠的模型迭代能力,讓再小的場景需求也能擁有專屬模型服務(wù)。
在平臺架構(gòu)上,星辰 MaaS 已與星辰 Agent 開發(fā)平臺深度融合,實現(xiàn)了從底層大模型到上層智能體應(yīng)用的完整閉環(huán)開發(fā)能力。開發(fā)者在構(gòu)建智能體應(yīng)用時,不僅可以調(diào)用通用能力,還能集成經(jīng)過微調(diào)的專屬模型,實現(xiàn)更高精度、更強(qiáng)適應(yīng)性的智能化服務(wù)。
目前,星辰開發(fā)平臺已經(jīng)匯聚超過 30 萬名開發(fā)者,廣泛覆蓋辦公、生活、導(dǎo)覽、客服、政務(wù)等多個典型場景,成為國產(chǎn)大模型生態(tài)中極具活力的開發(fā)社區(qū)之一。
“十大標(biāo)桿應(yīng)用方案”——眾多場景中的冰山一角
最后,在 AI 加速重塑工作模式的當(dāng)下,科大訊飛以大模型為核心,圍繞辦公、人力資源、企業(yè)數(shù)字化等核心場景,打造了“十大標(biāo)桿應(yīng)用方案”,全面助力各類組織實現(xiàn)效率躍升與智能化轉(zhuǎn)型。
在職場辦公中,升級后的訊飛智文從 PPT 工具擴(kuò)展為智能文檔平臺,支持多類型文檔生成、協(xié)同編輯與圖文智能生成;訊飛繪文則面向內(nèi)容創(chuàng)作者,提供從選題到發(fā)布的全流程AI創(chuàng)作服務(wù),提升內(nèi)容效率與質(zhì)量;星火紀(jì)要實現(xiàn)會議全過程智能化,自動生成紀(jì)要,顯著減輕人工整理負(fù)擔(dān);訊飛繪鏡通過一鍵視頻生成支持營銷培訓(xùn)場景,釋放創(chuàng)意效率。
在人力資源領(lǐng)域,訊飛智聘以簡歷解析、AI 面試等功能大幅降低初篩成本,并通過勝任力模型提升人才匹配精準(zhǔn)度;星火陪練則為一線崗位提供高效實訓(xùn)方案,可基于企業(yè)知識庫自動生成課程并支持移動端對練,評分準(zhǔn)確率達(dá) 90% 以上,每年對練場次超過 1000 萬場。
企業(yè)數(shù)字化方面,訊飛推出招投標(biāo)大模型與星火知識庫,分別用于自動生成標(biāo)書、智能評標(biāo)與復(fù)雜知識問答,已在多家央國企落地;星火快答則通過虛擬人和多模態(tài)交互,實現(xiàn)產(chǎn)品邊講邊演示。
此外,在更廣泛的行業(yè)與社會場景中,訊飛的大模型技術(shù)也在持續(xù)落地,包括:線下營銷、政務(wù)服務(wù)、文旅講解、公共服務(wù)、軌道交通、海外場景等等。
期待智能交互新時代!
從此次發(fā)布會的產(chǎn)品升級可以看出,隨著大模型能力不斷突破與交互方式持續(xù)進(jìn)化,科大訊飛正在加速推動人機(jī)交互方式的革新,不斷探索更具自然性、沉浸感和適應(yīng)性的智能交互形態(tài)。
正如趙艷軍在發(fā)布會最后的展望:
“這些只是我們眾多場景中的冰山一角,其實每一個場景都值得用大模型再重新做一遍。未來,我們會繼續(xù)將用最好的產(chǎn)品、技術(shù)和服務(wù),幫助開發(fā)者做出更多有創(chuàng)意、好用的產(chǎn)品。”
無論是職場辦公、行業(yè)落地,還是社會服務(wù),科大訊飛正以智能化、可對話、可執(zhí)行的產(chǎn)品體系,構(gòu)筑下一代人機(jī)交互的標(biāo)準(zhǔn),將 AI 融入人們的日常工作與生活,讓智能更有溫度,讓交互更具智慧。
未來已來,讓我們共同期待一個由智能交互驅(qū)動的全新工作與生活方式。
S、macOS等全員跳26,蘋果全家桶開啟“液態(tài)玻璃”新界面,Siri卻意外缺席
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.