這兩三年,國內外科技巨頭們都在摩拳擦掌,傾盡資源布局,試圖在AI技術革命中占據先機。
仔細想想,似乎大部分廠商在做的事情都很直白,也很簡單,那就是通過海量數據的預訓練,讓大模型擁有十八般武藝,知識問答、文案創作、數學題解答、邏輯推理等等,幾乎能夠輕松應對所有問題。
有趣的是,像這類幾乎“無所不能”的大模型,卻大多數都只有一種交互方式——“提問”。
你提問,它回答,就這么簡單。事實上,在今年開年火遍全國的DeepSeek就是一個相當不錯的例子。
在這個大模型技術如雨后春筍般涌現的時代,智能硬件的人機交互顯然也來到了一個發展的關鍵節點。
2025年6月12日,科大訊飛在深圳舉辦智能交互產品升級發布會,基于最前沿的人工智能技術,圍繞智能交互場景,開放全新平臺技術能力,發布企業級智能體創新引擎,并推出十大場景化標桿解決方案,助力合作伙伴創造出真實的業務價值。
(圖源:科大訊飛)
說得更簡單一點,在最新發布的AI交互技術和機器人超腦平臺的加持下,訊飛不僅試圖讓我們與機器的“交流”的方式變得更加簡單、流暢,更希望能讓機器去完成更多的工作,而不是像現在這樣,把一身能力全都限制在簡單的“對話”里頭。
或許有朝一日,“I,Robot”的劇情,真的會在現實中上演。
別提問,我們來交流吧
在開始之前,我想問大家一個簡單的問題。
在你看來,“交互”是什么?
在我看來,所謂人機“交互”,是指人與各種硬件之間通過特定界面和操作方式進行信息交換、傳遞指令、接收反饋并共同完成特定任務的過程。
上個世紀70-80年代,人們需要通過DOS命令和計算機你來我往;圖形化界面的誕生,讓更多的人能夠方便地使用計算機完成各種任務;移動通信的發展,讓觸屏手機成為我們隨身攜帶的必備品;而智能硬件的茁壯成長,似乎讓語音成為了這個時代最自然的交互方式之一
但真的是這樣嗎?
事實上,只要用過現在智能硬件語音交互的人,幾乎是隨手就能拋出一大堆問題,先不論需要關鍵詞喚醒和一問一答的交互方式到底有多拖沓,經常出現的回答滯后、語音識別不準等現象,更是會讓無效操作頻繁發生,而限制頗高的語音指令,也很難讓你去靈活調用各種設備進行調節。
像這樣的人機交互,顯然是不夠理想的。
那么問題來了,萬物互聯時代,所謂的AI交互應該是什么樣子?
嗯……首先,最起碼你聽說能力得到位吧。
(圖源:科大訊飛)
為了“聽清楚”,訊飛打造了從多麥克風陣列降噪收音到線性雙麥、四麥、6麥的多模態降噪技術,再有專為戶外移動場景降噪設計的3麥降噪方案,即便佩戴智能眼鏡在騎行、工地等嘈雜環境下,仍能精準識別語音指令;不僅如此,通過其AIUI等核心技術,訊飛將語音交互變得像人人交互一樣暢快自然,簡單說一句“我回家了”,系統就能瞬時地自動執行預設的燈光開啟、空調調至舒適溫度、窗簾拉開等一系列動作。
嫌交互太呆板?這次訊飛實現了全雙工超擬人交互,徹底打破了傳統“一問一答”的刻板模式。這就好比我們人與人之間的自然交談,可以在對方說話的同時插話并被理解共鳴。
(圖源:科大訊飛)
例如,在智能家居場景中,當設備正在播報信息或播放音樂時,用戶可以直接插話發出新的指令,如“聲音再大一點,然后切到下一首”,設備能夠連貫地理解并執行這一系列指令,使得交互過程如行云流水般順暢。
其次,僅僅能聽會道也不夠,更高級的交互需要機器具備“理解”的能力,尤其是理解言語之外的深層含義。
(圖源:科大訊飛)
觀察目前市面上絕大多數的人機交互系統,你會發現它們普遍缺乏有效的記憶機制和情感理解能力。這意味著設備記不住用戶此前的操作習慣、個人偏好以及歷史對話內容,也無法準確識別用戶當前的情緒狀態,整個交互過程顯得非常生硬、機械。
為此,科大訊飛在情感與個性化交互層面大力投入,致力于讓機器交互更有“人情味”。
現在,通過深入分析用戶的語音語調、語速變化等聲學特征,系統能夠敏銳地感知用戶的情緒狀態,甚至能夠適配兒童獨特的表達邏輯和不規范發音,并智能匹配相應情感的語音合成進行交互。
即便是寶寶牙牙學語的聲音,也能夠換來溫柔、安撫的回應。
(圖源:科大訊飛)
不僅如此,為了實現更深層次的個性化交互,訊飛還構建了包含上下文理解、用戶畫像沉淀和生活事件記錄的三層記憶體系。這使得設備能夠“記住”用戶的習慣與偏好,讓智能辦公軟件記住用戶的寫作習慣,聊天陪伴軟件能提供更個性化、更連貫的陪伴體驗,更能搭配智能穿戴設備,持續獲取健康建議和各種提醒。
豁,聽上去還真不賴。
值得一提的是,上面所介紹的這些AI交互能力的進化,不僅會深刻改變我們在智能家居、智能穿戴等消費級場景的應用體驗,更為機器人領域實現全新的人機交互升級奠定了堅實的基礎。
隨著具身智能技術的發展,各式陪伴機器人,教育機器人,服務機器人層出不窮,人與機器人之間的交互已經演變為機器人和人工智能技術發展的重點研究方向之一,其交互的自然性、智能性和協作性直接決定了機器人的應用廣度和深度。
其中比較標志性的,就是這款搭載了訊飛機器人超腦平臺能力的人形機器人。
(圖源:科大訊飛)
通過深度整合機器人超腦平臺套件,數字華夏的人形機器人在語音交互能力上實現了質的飛躍,不但在復雜環境下也擁有著出色的語音識別能力,還創新性地通過多模態降噪技術解決了多人交互場景下的識別難題。
同時,平臺集成的AIUI系統,使機器人具備了更深層的語義理解能力和知識運用能力。在此基礎上,數字華夏自研情感表達系統與情感計算系統,使仿人機器人在顏值、智商兼備的同時,也擁有相當的情商。
在發布會現場,訊飛還展示了一項新的技術。
(圖源:科大訊飛)
藉由訊飛超腦平臺部署“即插即用”的智能語音背包,這樣就能在不改造硬件本體的情況下,賦予宇樹機器人語音交互能力,進一步打通人與機器人的交互邏輯。
目前,和訊飛達成合作的機器人客戶已有500多家,他們都在致力于通過軟硬件一體化的快速集成,實現機器人能聽會說、能理解會行動的未來。
訊飛AI交互的技術能力,必然會在具身智能高階發展階段充分釋放。
虛擬人、智能體,樣樣在行
在這次大會上,訊飛還帶著大家一起回顧了一些技術里程碑:
2010年,訊飛發布了全球首個同時提供語音合成、語音搜索、語音聽寫等智能語音交互能力的移動互聯網智能交互平臺——“訊飛語音云”,意圖讓移動互聯網應用像人一樣“能聽會說”,讓輸入繁瑣的短信書寫和在線聊天更加便捷有趣。
2015年,訊飛推出的以自然語言理解為核心的全鏈路人機交互平臺——“AIUI開放平臺”,這次不僅要“能聽會說”,訊飛更希望快速讓傳統設備也加入“能聽會說,能理解會思考”的行列,為智能硬件人機交互帶來了體驗躍遷。
2023年,“訊飛星火認知大模型”橫空出世,作者本人也親歷了星火大模型的多個版本迭代,親眼見證了全國產算力的認知智能大模型是怎樣走到今天的,隨后,與之配套的應用、產品、技術平臺更是不斷涌現。
比如虛擬人。
(圖源:科大訊飛)
當然了,站在2025年中,沒人會對虛擬數字人感到陌生,隨手打開的電商平臺,爸媽愛刷的短視頻應用,甚至樓下大爺都能和你聊幾句他在銀行看到的虛擬客服。
不過,訊飛的虛擬人和那些“AI感”拉滿的同類還真不大一樣,依托星火大模型的虛擬人交互平臺,不僅擁有著最新的AI虛擬形象技術,更結合了業界領先的語音識別、語義理解、語音合成、自然語言處理(NLP)以及星火大模型等AI核心技術棧,可以輕松打造出適合展廳導覽、智能客服、員工培訓、在線面試等一眾場景的高質量虛擬人。
近年來熱度持續不低的智能體領域,科大訊飛也進行了深度布局。
其核心是訊飛星辰Agent平臺,這是一個低門檻、一站式的大模型精調與智能體構建平臺,不僅支持訊飛星火全系列大模型,還廣泛兼容如DeepSeek、Qwen3等業界主流的開源大模型,模型的使用和推理成本也很理想,旨在助力企業高效構建專屬大模型和智能應用。
(圖源:科大訊飛)
依托于此,訊飛也提供了一系列功能強大的智能體應用。
例如專注于AI內容創作的“訊飛繪文”,它能提供從選題分析、內容生成到多平臺發布及數據優化的全鏈路支持;原生AI文檔工具“訊飛智文”,能夠輕松完成從大綱構建、內容提煉到排版設計的PPT初稿生成,還有訊飛智作、訊飛繪鏡等,基本上已經涵蓋了從文檔處理、數據分析、視頻制作、社交互動等在內的全場景辦公需求。
能不能學會靈活應用這些東西,很可能成為新時代打工人的必備技能。
當然,還有更重要的,那就是其AI能力輸出和生態構建的核心載體——訊飛開放平臺。
(圖源:科大訊飛)
自訊飛星火正式發布以來,訊飛開放平臺已新增超過453.6萬開發者,其中大模型直接相關的開發者數量超過148.1萬,企業級用戶超過88.5萬。海外開發者團隊數51.8萬。
最后不得不提的是由科大訊飛發起并持續舉辦的AI開發者大賽,如今這項賽事已經成為一個全球性的人工智能競賽平臺,來自全球各地的人工智能產業的專業人才積極參與,共同推動人工智能前沿科學的研究和創新成果的實際轉化。
根據@奇異因子調查統計,訊飛是目前市面上應用布局最廣、產品矩陣最多元的廠商之一,目前,訊飛旗下已有三款應用突破百萬月活大關,訊飛星火4.0成為了2025斯坦福MixEval-Hard評測中唯一進入前十的中文大模型,企業中標數據更是力壓群雄,足見其在AI領域的技術積淀與創新實力。
(圖源:知乎@奇異因子)
正所謂一家獨大不是春,唯有生態的繁榮,才能創造AI更廣闊的未來。
大模型時代,交互將被如何重構?
如今,“大模型”就像當年的“互聯網”,給予整個市場無限想象力。
在大模型的熱潮之下,許多產業都值得被重塑一遍,其中就包括消費電子、家用電器、機器人、汽車等領域。大模型技術不應成為一個簡單的問答工具,這些領域的消費者都理應享受到深度智能交互所帶來的暢快感,而這正是科大訊飛希望通過這場發布會帶來的東西所實現的。
當前的智能家居市場,盡管發展仍然迅速,但用戶體驗卻存在諸多痛點和窘境。許多所謂的智能家居產品,其“智能”程度往往名不副實,設備間的互聯互通性差,操作復雜,語音助手反應遲鈍、理解能力有限,常常出現“人工智障”的情況,就像是一堆需要分別控制、指令刻板的“智能”單品。
在我看來,這種交互體驗上的落差,正是行業亟待突破的瓶頸。
機器人同樣是未來的重要趨勢。
尤其是人形機器人的前景非常可觀,據《人形機器人產業研究報告》預測,2024年中國人形機器人市場規模將達到約27.6億元,到2029年達到750億元,將占世界總量的32.7%,占比位居世界第一。
機器人超腦的一系列核心能力,能夠明顯提升機器人面對復雜任務時的應答和處理能力;融入AI交互技術之后,更是能進一步提升人形機器人在真實場景下的多模態感知與理解能力,實現以人為中心的深度智能協作。
如今,科大訊飛正成為智能家居、智能穿戴和多種機器人領域落地的首選。
或許機器人那邊還要等一等,但現在智能硬件正值一波以舊換新潮,如果能將這些產品與訊飛AI交互技術結合,就能夠為用戶創造更智慧的家居生活,也能為家電廠商、技術提供商帶來新的增長點。
有趣的是,如果你對科大訊飛的了解更深一點,你會發現他們的整個發展思路,早在大模型還沒有苗頭的時候就定下來了。
“讓機器像人一樣能聽會說、能理解會思考,用人工智能建設美好世界”,這可是訊飛在2014年提出的公司使命。
從20多年前讓機器能聽會說,到10多年前讓機器能理解會思考,再到現如今通過大模型賦能千行百業,試圖重塑人機交互新生態,科大訊飛在人工智能領域完成一次次跨越,成為一股敢為人先的國產科技力量。
可以預見的是,隨著記憶、推理和多模態能力的進步,未來機器人將通過自監督學習不斷優化自身,減少對人為干預的依賴,通過其智能化和個性化的服務處理更復雜的辦公流程,甚至代替你直接完成某些繁瑣而重復的工作。
屆時,科大訊飛或許真的會徹底重構我們的人機交互方式。
而剩下的問題,就要讓時間幫我們印證了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.