戴上 Gemini 很美好,做出這副眼鏡太不易。
作者|張勇毅
編輯|鄭玄
今年 Google I/O 之后,Android XR 作為 Google 下場 AI 眼鏡領域戰(zhàn)略中的關鍵一步,被再次詳細介紹——不僅有 Google 自家搭載 Android XR 的 AI 眼鏡作為壓軸戲,在主題演講中登場。
如此高規(guī)格,很難不讓人想起 2012 年、同樣是在 Google I/O 上發(fā)布的「上古級 AI 眼鏡」Google Glass、彼時謝爾蓋-布林佩戴著它,從飛機機艙內(nèi)跳出同時全程直播,至今仍然是科技史上讓人津津樂道的名場面。
但 Google Glass 并不是一款在商業(yè)上取得成功的產(chǎn)品。十三年后,謝爾蓋-布林再次來到 I/O 現(xiàn)場,為 Google 在 AR 眼鏡領域的下一步背書,甚至不惜在接受媒體采訪時,承認自己在 Google Glass 項目上「犯了不少錯誤」。
「我當時根本就不了解消費電子供應鏈,真的,也不清楚打造這么一款眼鏡,然后以合理的價格銷售以及管理所有制造流程等等究竟有多難。」謝爾蓋 - 布林在接受媒體采訪中如此「懺悔」道。
布林還提到十幾年前 Google Glass 誕生時還存在「技術差距」,但這在今時今日已不存在。「如今在 AI 領域,這些眼鏡能夠幫助你,同時又不會一直分散你的注意力,這就比以前有用多了。」
謝爾蓋布林接受媒體采訪 | 圖片來源:Google
近兩年隨著 Google 憑借 Gemini 以及一系列 AI 能力落地的產(chǎn)品,在市場上逐漸占據(jù)一席之地,謝爾蓋-布林這位當年的傳奇創(chuàng)業(yè)者,再次回到 Google 活躍并參與到 Gemini 的研發(fā)工作中,他的發(fā)言,很大程度上代表了 Google 當下對于 Android XR 乃至 AI 眼鏡的態(tài)度:硬件載體甚至包括 Android XR,都不是當前的最重點,以 Gemini 為代表的一整套 AI 能力才是。
Google 現(xiàn)場演示的 AI 眼鏡 Demo | 圖片來源:極客公園
在 Gemini AI 能力展區(qū)中,Google AI 眼鏡 Demo 的演示也是排隊最多的展區(qū);不少開發(fā)者在現(xiàn)場頂著太陽,排超過一個小時的隊伍,只是為了能在高度保密的展示區(qū),體驗不到五分鐘的 Google AI 眼鏡能力。
不只是謝爾蓋布林,Google 甚至直接在主題演講中,直接宣稱眼鏡將會是「Gemini 的最佳載體」,將其地位置于智能手機以及其他所有 AI 硬件形態(tài)之上。
作為在 Meta 與 Apple 之后,踏進同一條河流的硅谷巨頭,Google 這次真的能依靠著 Gemini,重新在 XR 領域復刻 Android 的成功嗎?
01
時隔十三年的夢
或許對謝爾蓋布林來講,Google Glass 的失敗是他至今難以接受的一件事——尤其是當你先別人一步看到未來,但因為現(xiàn)實的技術條件限制不得不放棄、如今卻被 Meta 搶先在商業(yè)上取得成功的情況下。
在采訪中,謝爾蓋布林還特別指出,現(xiàn)在的谷歌不用再孤軍作戰(zhàn),他們已經(jīng)有了三星(Project Moohan)、Xreal(Project Aura)這樣的「優(yōu)秀合作伙伴」一同發(fā)展 Android XR。
據(jù)筆者了解,Android XR 項目立項于這一波 AI 硬件浪潮尚未正式爆發(fā)的 2022 年。最初的核心指標,是打造一款「盡可能獨立運行、不依賴智能手機或者其他外部計算設備」的 AI 眼鏡——這意味著眼鏡需要同時內(nèi)置處理器、電池以及各種傳感器,因此最初的 Demo 更像是滑雪護目鏡那樣笨重的外觀。
但這樣打造出來的產(chǎn)品,顯然與 Google 高層希望打造的「全天候佩戴的 AI 助理」概念相去甚遠,因此 Project Iris 項目在 2023 年年初被爆出遭遇「重大挫折」,并伴隨著一系列人事變動,同時產(chǎn)品方向進行了重大調(diào)整。
方向調(diào)整過后的 Project Iris,不再追求眼鏡端獨立計算,而是追求通過與 Android 系統(tǒng)智能手機(特別是 Google 自家的 Pixel 系列手機)的計算聯(lián)動,由手機承擔主要的計算需求,眼鏡本身作為一個「終端傳感器」,僅需要完成必要的傳感器信息處理與收集。
隨著之后 2023-2024 年 Google 內(nèi)部又進行了多輪裁員,負責 AI 眼鏡團隊也遭到了波及,自研 AI 眼鏡的計劃也在之中被徹底取消,取而代之的是與三星、XREAL 這樣的公司合作,負責產(chǎn)品主要的硬件開發(fā)與最終上市/銷售——這也是今年內(nèi) Android XR 會上市的兩款硬件的硬件合作方。
在今年 Google I/O 現(xiàn)場開放體驗,完成度明顯更高的三星 Project Moohan,筆者體驗過后覺得其已經(jīng)在重量上相比 Apple Vision Pro 有著巨大優(yōu)勢,目前其中 Gemini 也能依靠更加強大的算力,完成包括屏幕內(nèi)容識別、自動推薦內(nèi)容等場景。
據(jù) Google 員工介紹,雖然名稱上 Android XR 仍然隸屬于 Android,但實際上 Google 已經(jīng)將其作為「面向原生 AI 需求的操作系統(tǒng)」來構建基礎架構,在原生 Android 的基礎上進行大幅調(diào)整,讓 Gemini 能低功耗運行在系統(tǒng)底層,從而盡可能在系統(tǒng)層面上滿足「低功耗全時運行」這一指標。
三星在 Google I/O 提供的 Project Moohan 體驗 | 圖片來源:極客公園
在現(xiàn)場體驗中,筆者不僅體驗到了在虛擬顯示操作系統(tǒng)中,直接與 Gemini 進行語音交互,Gemini 還能無需額外權限,直接讀取當前屏幕內(nèi)顯示的所有內(nèi)容,例如當你在搜索中輸入某個餐館的點評信息,然后詢問 Gemini「如何前往這家餐廳」,Gemini 就能立即創(chuàng)建一個新增的導航界面。
但在 Google 內(nèi)部多輪裁員的影響下,最終 Android XR 將硬件產(chǎn)品發(fā)展方向,確定為了「與 OEM 廠商合作打造 Android XR 硬件」,也就是如今我們看到的三星、XREAL 首發(fā)硬件陣容。
這種模式非常類似早期 Android 系統(tǒng)上 Google 與智能手機廠商的合作模式,Google 將重心放在 Android 系統(tǒng)本身的開發(fā),市場份額的攻城略地依靠智能手機品牌來完成——只是這次 Gemini 成為了新的主角,Android XR 只是一個供 Gemini 大展身手的原生新平臺。
對 Gemini 來講,XR 類設備的最大潛力在于它相比手機、電腦等單一場景下的智能硬件,能在系統(tǒng)級的基礎上,兼顧虛擬世界與現(xiàn)實世界的信息感知,從而大幅提高 Gemini 接管用戶日常使用的場景的比例,而 AI 眼鏡更是能獲得幾乎「無限」的現(xiàn)實世界信息,進而大幅提高 Gemini 在用戶日常生活中的存在感。
Android XR 中 Gemini 的對話效果|圖片來源:極客公園
圍繞著這樣的場景,Google 其實已經(jīng)蟄伏已久:2024 年,Google DeepMind 公布 Project Astra :一個前沿的 AI 助手項目。旨在打造一個能夠理解和響應我們周圍世界的通用人工智能助手。基于 Gemini 實現(xiàn)不僅僅是被動回答問題,而是主動去嘗試理解用戶的意圖,通過關鍵信息記憶 + 多模態(tài)能力識別,實現(xiàn)類似「用戶把某樣東西放哪里了」這種上下文信息的回溯。同時進行實時語言翻譯以及協(xié)助處理信息等任務。
Google 在多模態(tài)模型領域的長期投入,讓 Gemini 成功成為了 Android XR 整個概念中的「明星」,引爆了外界對 AI 眼鏡這一品類的期待,尤其是 Google 宣傳的「全天候感知周邊環(huán)境」、「主動預測用戶需求」等場景,似乎真正的足夠智能的多模態(tài) AI 眼鏡已經(jīng)出現(xiàn)。
Google 現(xiàn)場演示的 Gemini 以 AI 眼鏡為載體、識別現(xiàn)場的內(nèi)容 | 圖片來源:極客公園
在 Google 在 I/O 現(xiàn)場演示的 AI 眼鏡 Demo,其產(chǎn)品整體形態(tài)類似 Rokid、雷鳥此前已經(jīng)發(fā)布過的產(chǎn)品,最主要的區(qū)別在于這款 AI 眼鏡 Demo 運行 Android XR 系統(tǒng),能在一定程度上支持由現(xiàn)有 Android 應用轉制開發(fā)而來的 Android XR 應用。
在 Google 的設想中,Android XR 應該是覆蓋了現(xiàn)有全部 XR 設備——從體積最大、直接對標 Apple Vision Pro 的三星 Project Moohan,到由 XREAL 打造、搭載 Android XR 操作系統(tǒng)的 AR 眼鏡 Project Aura,再到 Google 自家現(xiàn)場可供體驗的 AI 眼鏡原型。
在 Google Keynote 主題演講中出現(xiàn)的 XREAL Android XR 眼鏡「Project Aura」|圖片來源:極客公園
據(jù)接受《極客公園》采訪的 Android 團隊工程師介紹,三星 Project Moohan 項目立項于 Apple Vision Pro 正式發(fā)布之后,定位狙擊蘋果 XR 戰(zhàn)略,三星也在期待著蘋果能用其自身舉足輕重的市場影響力,將 XR 領域的最難的部分:無論是供應鏈還是用戶對 XR 頭顯的市場認知教育問題解決。
但 Apple Vision Pro 的銷量與市場反響均不及預期,這在很大程度上也影響了 Google 與三星對這一項目的信心,因此 Google 隨即大幅下調(diào)了 Project Moohan 的出貨預期,同時售價更低、且整體重量更加輕便的 XREAL Project Aura 被進一步寄予厚望,作為首批上市 Android XR 硬件中承擔出貨量預期的主要產(chǎn)品——按照 XREAL 預計,搭載 Android XR 的首款 AR 眼鏡銷量將超過三十萬臺。
至于在今年 Google I/O 期間展出并小規(guī)模體驗的、實際上是 Project Iris 項目的存貨,最終并不會實際上市。
據(jù) XREAL 創(chuàng)始人徐馳介紹,在目前的預計中,Android XR 首批上市設備中出貨量最大的設備會是 AR 眼鏡,這一點也是決定 Android XR 在今年內(nèi)能否快速推廣、得到用戶認可的關鍵一步,因此硬件上 Project Aura 這款產(chǎn)品幾乎完全由 XREAL 主導,借助相對已經(jīng)成熟的硬件體驗,輔以 Android XR 操作系統(tǒng),實現(xiàn) Android XR 生態(tài)的快速構建。
XREAL Project Aura 將 AI 作為新品的主要賣點 | 圖片來源:XREAL 官網(wǎng)
XREAL、三星均計劃在正式的產(chǎn)品最終開售之前,通過開發(fā)者套件的形式提前發(fā)布,讓開發(fā)者有機會提前上手全新的操作系統(tǒng),以及 Gemini 在這個全新的空間操作系統(tǒng)中,能在給第三方 App 提供哪些全新的接口,提供端側 AI 能力的支持。
02
「燙手山芋」
誠然十三年后的智能眼鏡供應鏈,已經(jīng)足以打造出遠超 Google Glass 的成熟硬件,但當前的硬件水平,實際上能否打造出一款如同 Google 宣傳的那樣、「始終在線的 AI 助手」,對 Google 而言仍然充滿挑戰(zhàn)。
比起謝爾蓋布林「硬件已經(jīng)不存在差距」的自信,實際上 Google 最終放棄打造第一方 AI 眼鏡,很大程度上也確實是受限于當前硬件技術,仍然無法在 AI 眼鏡這個載體上,完全實現(xiàn) Google 為 Gemini 構想的一系列使用場景。
據(jù)參與到 Android XR 項目的相關項目成員介紹,目前 Google 在 Android XR 硬件中,類似 Project Astra 那樣、幾乎是全時感知處理用戶周邊環(huán)境中各種信息的使用場景,是如今智能眼鏡這一載體難以承載的功耗。因此如何支撐眼鏡擁有一個用戶可以接受的日常使用電池續(xù)航,以及如何處理眼鏡傳感器在端側接收到的用戶/環(huán)境數(shù)據(jù),是主要難點。
不同于 Meta Ray-Ban 依賴藍牙協(xié)議,將所有眼鏡端接收到的用戶數(shù)據(jù)傳輸至用戶手機,交由手機處理再將結果發(fā)送回眼鏡端的解決方案,Google 在搭載 Android XR 的 AI 眼鏡原型早期方案中,嘗試讓眼鏡端完成主要的數(shù)據(jù)處理,僅將大模型交互、即時信息查詢等請求轉發(fā)給手機處理。
在架構上 Android XR 能夠滿足這樣的要求,但硬件上,即使 Google 相比 Meta 有 Android 系統(tǒng)作為優(yōu)勢,但在「全天候佩戴的 AI 助理」這個目標上,硬件的限制仍然非常明顯。
「硬件中無論功耗、續(xù)航都不是簡單的問題,全部都是坑。」Android XR 工程師這樣介紹 Google 在 AI 眼鏡項目中遇到的難題,
據(jù)介紹,一款 AI 眼鏡量產(chǎn),首先要做 DFM(可制造化設計),同時做出來的 Demo 要能高效生產(chǎn)。但目前 Google 內(nèi)部演示的 Demo 完全沒有考慮到續(xù)航這一問題,換言之這款產(chǎn)品更多是為了向外界公開演示 Gemini 能在 AI 眼鏡這個形態(tài)上做到的最大可能性,而非一款目標最終大規(guī)模量產(chǎn)的產(chǎn)品;僅僅是使用 Gemini 識別眼前內(nèi)容并交互,這款 Demo 的實際續(xù)航也無法超過兩個小時。
同時,如何在算力極為有限的智能眼鏡端側,運行各種基于實時感知的顯示內(nèi)容,至今仍然是難以解決的問題;包括 Google 曾在去年年底展示過、使用 Google Maps 實現(xiàn)實時導航的功能,如今都暫時無法實現(xiàn)。
即使這些瓶頸現(xiàn)實存在,但 Google 的工程師依然希望將 Gemini 作為未來 AI 眼鏡交互的重點,因此 Google 走上了與 Meta 相同的技術路線——首選無顯示功能的眼鏡形態(tài)。
值得一提的是,雖然 Google 本身算是可穿戴領域的老兵,但對于如何造好 AI 眼鏡,借此與蘋果與 Meta 競爭這件事并沒有充分的經(jīng)驗,但同時也在裁員的同時,從外界招募了眾多行業(yè)一線研發(fā)人員來充實隊伍,其中不乏前 Meta 甚至是前 AVG(Apple 內(nèi)部負責 Vision Pro 業(yè)務的事業(yè)群)的大牛加入。
目前,Google 內(nèi)部目前有數(shù)千人的開發(fā)團隊負責完善 Android XR 在這些硬件上的開發(fā)完善、乃至后續(xù)的支持。
雖然今年 Google 公開展示的 AI 眼鏡 Demo,實際上并不會最終上市。但憑借著 Gemini 在 Android XR 中統(tǒng)治級的地位,Google 仍然在竭力拓展 Android XR 的生態(tài)圈。
2024 年,Meta 與依視路(雷朋 Ray-Ban 母公司)在 Meta Ray-Ban 系列上的合作大獲成功,Google 也在 2024 年開始,嘗試在時尚領域尋找有「強烈合作意愿」的合作伙伴。
最終,曾經(jīng)有與華為聯(lián)手打造智能眼鏡合作經(jīng)驗、但因為雙方理念不合分手的 Gentle Monster,以及美國本土主打時尚感的新興眼鏡品牌 Warby Parker,成為了 Google 打造 AI 眼鏡時的時尚品牌合作伙伴。
但這些時尚品牌并不具備足夠的硬件開發(fā)能力,最終它們的 AI 眼鏡項目仍需要有足夠經(jīng)驗的硬件合作方來代工完成,因此這些產(chǎn)品的最終量產(chǎn)與迭代,仍然會選擇對應的中國 AI 眼鏡代工廠來完成。
與目前 Google 展示出來、帶有基礎顯示能力的 Demo 不同,這兩家時尚品牌與 Google 合作打造的 AI 眼鏡,都將會是與 Meta Ray-Ban 類似、沒有內(nèi)容顯示能力,完全依靠語音與 Gemini 實現(xiàn)復雜交互。
即使 Google 未來仍然有打造 AI 眼鏡的計劃,也會將重心放在「與硬件廠商合作」這一方向上,減少谷歌在 AI 眼鏡上硬件投入的比例,專注于完善 Android XR ——尤其是 Google 最看重的 Gemini 體驗。
除了現(xiàn)在已經(jīng)廣為外界熟悉、直接對標 Apple Vision Pro 形態(tài)的產(chǎn)品 Project Moohan,三星還在籌劃另外兩款在 Android XR 操作系統(tǒng)的設備,Project Haean 與 Project Jinju;與 Moohan 對應的韓語單詞「無限」相同,這兩款設備的代號同樣來自韓語音譯,對應的意思分別為「海濱」與「珍珠」。
前者是一款由三星打造、搭載 Android XR 操作系統(tǒng) AI 眼鏡,在外形輕薄的同時支持與 Gemini 實現(xiàn)語音交互,同時有著比 Meta Ray-Ban 更長的續(xù)航時長的 AI 眼鏡產(chǎn)品,后者目前即使是 Google 內(nèi)部,也鮮有人知準確的產(chǎn)品形態(tài),但根據(jù)目前信息綜合判斷,Project Jinju 將會是一款帶有實驗性質(zhì)、同時帶有更加復雜的內(nèi)容顯示能力的 AI 眼鏡形態(tài)產(chǎn)品。
即使 AI 眼鏡最終仍然要經(jīng)歷 2-3 年的市場成熟期,谷歌仍然能夠憑借 Android XR 為生態(tài)布局,加上與三星這樣的后發(fā)行業(yè)巨頭、XREAL 這樣新興但已經(jīng)占有一定市場份額的 AR 眼鏡廠商。嘗試復刻 Android 的成功,而不是 Google Glass 的失敗。
*頭圖來源:極客公園
本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO
極客一問
你如何看待 Google AI 眼鏡?
這下誰還需要 5 毛錢特效?Luma AI「修改視頻」功能樸素拍攝秒變好萊塢大片。
點贊關注 極客公園視頻號 ,
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.