智能的 Siri 明年再見,AI 創新交給數百萬開發者。
文丨賀乾明 黃俊杰
制圖丨黃幀昕
編輯丨黃俊杰
《蘋果發布令人失望的一季報》
蘋果宣布其銷售速度在第一財季顯著放緩,這將導致該季度營收和盈利表現低于預期……
截圖來自蘋果官網
以上是蘋果 25 年前業績下滑時所發布的官方新聞稿的開始,沒有修飾、沒有辯解。今天已經幾乎不再能看到一個上市公司以這樣的誠實公開面對失敗,包括蘋果自己。
北京時間 6 月 10 日凌晨,WWDC 全球開發者大會上,蘋果以今天它所能有的最大程度暗示了自己的失誤。在兩小時的新系統、新用戶界面、新功能逐一介紹前,蘋果 CEO 蒂姆·庫克沒有再回顧蘋果的各種進展,他的軟件負責人克雷格·費德里吉(Craig Federighi)上來先說了兩點:
- 去年宣布的 Apple Intelligence 很多功能上線了,但引入 AI 的新 Siri 要達到蘋果的質量標準還需要更多時間,明年會有更多消息。
- 蘋果通過 “基礎模型框架”(Foundation Models framework)對所有應用開放本地模型(或者叫端側模型)。
今天,這個市值 3 萬億美元公司的霸權不會因為一年,甚至三年不升級系統用戶界面設計而被動搖。
但蘋果在今天最重要的軟件技術研發上遠遠落后于對手。Apple Intelligence 發布一年也沒有兌現最初承諾的功能,蘋果 AI 的負責人,曾經在 Google 負責收購 DeepMind、把 AI 融入核心產品的約翰·吉安南德雷亞(John Giannandrea)已經被解除大部分管理職責。
今年 1 月,庫克讓蘋果的救火隊長金·沃拉斯(Kim Vorrath) 接管 Apple Intelligence 和 Siri 的開發管理。這位軟件項目管理副總裁 1987 年就加入蘋果——如果喬布斯活到現在且一直在工作,在職時間都比她少一年。在初代 iPhone、第一款 Apple Watch、Vision Pro 等劃時代產品進度落后時,都是沃拉斯帶隊調整團隊架構、砍去功能、在周末開產品沖刺會,最終讓產品能夠按期發布。
今天 Apple Intelligence 相關的一系列調整都是對早先失敗的補救,需要更長時間才會有結果。
開放本地模型則是 AI 生態的顯著進展。AI 軟件開發者以幾行代碼就能調用 iPhone、iPad、MacBook 內置的模型。新模型性能基本達到 GPT-3.5 水平,雖然幻覺會更嚴重,但可以離線使用,最重要的是開發者不需要付一分錢就能用——用戶在買硬件的時候付過了。
這是今天這個兩小時發布會上帶來的最重要進展,在今天只有蘋果才可能實現。
AI 應用的困境,大模型費用跟著用戶使用量等比增長
“調一次 DeepSeek 的大模型就花掉幾分錢,累加起來很容易能吞掉所有利潤。” 筆記應用 flomo 聯合創始人劉少楠對《晚點 LatePost》說,用貴的模型效果好,商業上未必成立,一個用戶調用模型花的錢很容易就會超過他付的費用。
但不用大模型,體驗又確實有差異?!熬拖褚苿踊ヂ摼W到來時,同行都做了 App,而你只有網頁版,注定會被淘汰?!?劉少楠說開發者沒有太多選擇。現在他設計新功能,都會花 1/3 時間算成本:多少用戶會用?每天用幾次?如何讓用戶滿意,但又能減少交互輪次——每用一次多一筆費用,一年 99 元的會員費可能很快就沒了。
在移動互聯網時代,他很少會這么仔細算賬。因為曾經軟件和互聯網產品都是低邊際成本,只要不涉及線下補貼,一個生意的成本通常不會隨著用戶規模增加等比擴張。早期試錯成本可控,用戶多了以后也比較容易盈利。
大模型不一樣,算力極貴,開發者成本隨著使用量等比上升,沒有規模效應,只有線性增長。每個應用一出生就進入美團、滴滴早年一樣的高難度模式,要么能融資、要么會算賬。
多鄰國今年一季度毛利從一年前的 73% 跌到了 71%,少賺 400 多萬美元,主要原因就是上線 AI 功能。多鄰國只有 7% 的付費用戶選擇了支持大模型的 Max 會員,而且每個人月費翻倍到 30 美元。如果更多人用大模型,它的利潤率下滑將更劇烈。
OpenAI ChatGPT 的數據更驚人:每個月有 2000 萬人支付超過 20 美元,毛利率只有 40%,比賣硬件的蘋果低得多。而傳統 SaaS 能到 75% 以上。算上研發成本,OpenAI 今年預計要虧近 100 億美元。
“如果每個功能都用領先的大模型,怎么算都是虧?!?多位 AI 產品開發者告訴我們。一位國內頭部云廠商高管則表示,大模型價格已經足夠低,短期內很難再有大幅下降。
成本增加風險,風險限制創新,新興的 AI 應用行業更難跑出新公司。
免費的本地模型,性能追上第一代 ChatGPT
蘋果開放的本地語言模型參數 30 億,在其內部基準測試中能力接近 Google 前不久發布的 Gemma 3(40 億參數)。比去年的版本有明顯提升。
蘋果稱,它可以用來生成摘要、提取信息、理解文本、優化內容,或者生成游戲中的對話等。在大模型競技場(Chatbot Arena)的評測中,40 億參數的 Gemma 3 得分已經接近 GPT-4。
就像開發者調用云上部署的大模型開發應用一樣,開發者可以用自有數據訓練蘋果基礎模型的 “適配器”(adapter),讓模型解決特定任務時效果更好,還能調用工具擴展模型功能,比如搜索本地或在線數據庫中的信息,或者調用應用程序中的服務。
蘋果提供的 30 億參數基礎模型 “幻覺” 多于 1750 億參數的 GPT-3.5,但不少任務并不需要這些能力。
“大模型的優勢在于記住了大量世界知識,能穩定輸出并做復雜推理?!?一位研究小參數模型的研究員說?!靶的P鸵呀涀銐驈碗s,也有強大的推理能力?!?/p>
比如讓大模型寫一篇含敏感信息的文章,只有成文環節需要云端大模型,脫敏、潤色、修改等步驟,本地模型就能完成。
本地模型對于更復雜的應用也有幫助,根據我們測算,如果使用推理模型里比較便宜的 DeepSeek-R1,開發者哪怕只是在手機分流 10% 的大模型調用量,每年支持 100 萬日活應用就能節省超過 300 萬元模型費用。
“就算不考慮隱私和成本,本地模型也有優勢。" 上述研究員說。研究者正嘗試去實現 “自主學習”:根據用戶使用模型的數據,持續增強大模型。本地算力免費,可以根據不同用戶的需求,讓模型衍生出不同的版本。
而云上部署模型想要成本可控,就要讓客戶大規模調用一個模型,用大規模并發攤薄成本,且要考慮訪問的峰谷問題。如果云上推理不同的模型,云廠商要么漲價,要么虧更多。
不過蘋果免費開放的本地模型,還不支持 “自主學習” 功能。
開放的本地語言模型之外,蘋果新訓練了一款在私有云中部署的新語言模型,采用 MoE 架構,總參數達到 1000 億,回答問題時激活參數 170 億,在內部基準測試中超過了參數相當的開源模型 Llama-4-Scout,但能力還比不上參數更大的 Qwen-3-235B、GPT-4o。
蘋果還訓練了視覺模型,本地版本有 3 億參數,云端模型有 10 億參數,內部基準測試中效果超過 Qwen-2.5-VL-32B,比 Llama-4-Scout 和 GPT–4o 更差。目前它們只供 Apple Intelligence 使用。按照目前的進展,蘋果大概率也會將視覺模型的本地版對外開放。
追趕靠的是數十年積累的軟硬件控制力
蘋果的大模型研發是美國科技七巨頭里最晚的,研發能力很可能也是最弱的。它最新的本地模型也不一定比 Google 強,但隨著這一輪操作系統更新,用上本地模型的設備基數將遠遠大過整個 Android 生態。
上個月,Google 向 Android 開發者提供集成本地模型 Gemini Nano 的開發工具,但不像蘋果直接開放大模型的 API,只有摘要總結、潤色文本、改寫文本、描述圖像這 4 個定制好的 API,這限制了開發者的創造力。并且這些 API 只有運行內存超過 16 GB、用上先進芯片的手機才能使用——全球上千款在售的 Android 機型,現在只支持 22 款。
在手機上順暢運行大模型,需要模型開發者、操作系統供應商、硬件廠商、芯片公司共同參與,是一個系統工程。在銷量有限的 Pixel 品牌之外,Google 只占其中兩層。
“如果芯片公司不愿意開放更多權限,再強的模型也發揮不出來好效果。” 一位小參數模型研究者說,為 Android 手機開發大模型,基本都需要適配不同芯片公司的底層框架,而這些芯片廠商都想要抓住機會做 “移動端 CUDA”,綁定開發者獲得更大的市場空間。
電腦更復雜,美國芯片公司正陷入一場內戰:原本開發 CPU 的英特爾、AMD 想推廣自家的 GPU;英偉達要開發電腦用的 SoC;高通想統一手機、電腦芯片架構,也開發了電腦 SoC。
控制芯片設計、操作系統、硬件生產、應用商店全流程的蘋果沒有這些麻煩。它的開發者可以只熟悉一種框架,就可以開發出部署到 iPhone、Mac、iPad、vision Pro 上的 AI 應用。蘋果在最新的開發文檔中告訴開發者,不用考慮 AI 應用運行的系統。
過去幾年,蘋果甚至還統一了不同設備的規格,讓所有的新產品都能滿足運行本地模型的條件。
2022 年的 iPhone 14 開始,蘋果給低端的非 Pro 系列使用上一代芯片,以增加差異性。但這個策略只執行了兩年。
從 iPhone 16 系列開始,蘋果又把同代手機芯片拉到同等水平。包括單攝像頭的 iPhone 16e 在內,所有 iPhone 都用上同樣的 8GB 運行內存、NPU 算力都是 35 TOPS——最大的差別是少了一兩個 GPU 內核,并不影響運行大模型。
2024 年開始,iPad 全都提升到至少 8GB 內存。Mac 電腦則從 16GB 起步,能運行 70 億參數的模型。
10 億 iPhone 用戶平均三年多換一次手機。這意味著到明年結束,大多數人手中的 iPhone 都已經可以在本地運行大模型。AI 應用開發者不可能忽視這樣一個龐大的統一市場。
Apple Intelligence 本該是蘋果的樣板應用,現在創新只能寄望于應用開發者
2007 年,iPhone 剛發布時還沒有應用商店,除了手機基本的電話、短信等功能之外,只有瀏覽器、iPod、股票、日歷等幾個應用。當時還沒怎么涉足互聯網服務的蘋果拉 Google 做了地圖和 YouTube 應用。
這些應用最終成為現代智能手機的樣板應用,告訴開發者可以做出怎樣的新應用。次年 App Store 上線,移動互聯網時代就此開始,創造了一個又一個新巨頭,也讓蘋果成為 3 萬多億美元市值,凈利潤接近千億美元——在全球僅略低于壟斷沙特石油的沙特阿美公司。
Apple Intelligence 本該是控制一切軟硬件的蘋果再次打樣,告訴開發者,AI 應用的未來在哪里。
蘋果在 2018 年就從 Google 挖來資深管理者約翰·詹南德雷亞,并為 AI 設立了獨立的組織架構。它在去年 WWDC 允諾新版 Siri 將有三個能力:
- 調用郵件、短信、文件、聯系人等個人信息回答用戶提問。比如 “媽媽會乘坐哪個航班、什么時候到來”“XXX 推薦的書單是什么” 等等。
- 理解屏幕上發生的事情,自動執行操作。比如朋友發來新地址,可以讓 Siri 存到聯系人信息中。
- 橫跨多個應用執行任務。理論上可以比較美團外賣、餓了么、京東外賣的肯德基價格,自動下單——也就是現在許多公司設想的手機 Agent。
到現在一個都沒有變成現實。
幾經延遲上線的其他 Apple Intelligence 功能,實際表現也極其糟糕:系統通知總結出現幻覺,錯誤將 BBC 關于美國醫保 CEO 刺客被捕的報道總結成槍擊者在獄中自殺;文本生成表情包的 Genmoji 功能勉強能用,但手機發燙嚴重;文生圖 Image Playground 表現接近幼兒園水平。
這是蘋果從組織管理到研發投入方面的失敗。據媒體報道,當時統管 AI 的詹南德雷亞懷疑大模型的價值,他認為用戶可能不需要 ChatGPT 這類工具。
蘋果也沒有迅速加大 AI 基建投入。OpenAI 發布 GPT-4 之后,美國科技巨頭全部大舉擴張,投建新的算力中心,爭搶研究者。蘋果的研發投入、算力基建(資本開支)都一度下滑,直到 2024 年底才開始大幅增加。
今年上半年,詹南德雷亞的職權大幅削減,Siri 交給原本負責 Vision Pro 的高管邁克·洛克威爾(Mike Rockwell)。Apple Intelligence 功能的開發,也像蘋果研發 iPhone、Mac 這些硬件產品一樣,分散到不同的團隊中。
蘋果最新發布的 Apple Intelligence 功能有了明顯變化,現在都融入到各個操作系統中的垂直場景中:
- iPhone 的通話功能中新增通話保持助理,它可以幫你排隊等人工客服接電話,或者預篩陌生的電話;
- 通話、FaceTime、短信等場景增加 “同傳功能”,本地模型可以實時翻譯語音通話、短信交流時的不同語言;
- 原本只用本地模型支持的文生圖功能,現在也可以調用 ChatGPT 處理(去年僅限于 Siri 使用);
- 用 Apple Watch 運動時,配上一個分析你運動記錄的話癆虛擬教練,在你耳邊解說運動情況,然后鼓勵你;
- Mac 上的 Intelligence Actions 功能,可以直接調用本地模型、蘋果私有云模型或 ChatGPT 執行指定任務。
相對大一點的新功能是 “Visual Intelligence”,由蘋果新訓練的視覺模型提供支持。當你截屏后,圖片下方會自動跳出來 “操作建議”,比如搜索同款商品購買、提取活動信息加入到日歷中。
蘋果展示 Visual Intelligence 功能。
這像蘋果去年給改版 Siri 設計的理解屏幕內容功能變體,但蘋果限制了它的功能,只提供特定的操作建議。如果你想要更高的自由度,可以直接點擊左下角的按鈕,向 ChatGPT 提問。
這些 Apple Intelligence 的新功能大多為蘋果高管在設備上實際操作,而不是像去年那樣用視頻展示 Demo。它們甚至不全由大模型驅動,也不再顯得無所不能。蘋果更希望它們可控、能如期交付。
“我們相信,要擁有和掌控我們所制造產品背后的主要技術”
2009 年,當時還是蘋果首席運營官的庫克代替癌癥病情惡化的喬布斯參加財報電話會。分析師問他的第一個問題是 “在沒有喬布斯的情況下,蘋果將如何運作”。
“我們相信,要擁有和掌控我們所制造產品背后的主要技術,并且只進入那些我們能夠做出重大貢獻的市場?!?庫克說。
過去十幾年,蘋果對硬件制造,特別是芯片技術堅定投入。到 2023 年,臺積電被蘋果推著去造 3 納米制程工藝芯片的時候,三星、高通等對手已經不再愿意巨資采購這樣的新技術。
庫克是一個了不起的接班經理人,因為他緊緊抓住硬件背后的主要技術,保證了蘋果連續十多年的驚人增長。當大模型快速進化,逐漸能完成一個又一個不同的任務,整個行業需要個人手機、電腦分擔運算成本的時候,只有蘋果能及時普及這樣的基礎設施。今天蘋果能在初代 ChatGPT 上線兩年半之后把跟它同等性能的模型裝進幾億 iPhone。
但他沒能掌控大模型爆發后的主要技術。于是今天蘋果的 AI 研發依然顯著落后于主要科技巨頭。特別是目前最先進的推理大模型,蘋果沒有拿出任何有競爭力的產品。與此同時,OpenAI、Google 的大模型哪怕跟半年前相比都有長足進展,差距越來越大。
在 AI 的權力游戲里,蘋果的話語權將不得不比移動互聯網時代有所降低,它會更依賴第三方開發者的創新。這對蘋果龐大財富的繼續增長是個問題,特別是現在歐盟和美國政府都開始限制蘋果對應用商店的管控,直接影響它的抽成能力。但對于整個軟件生態的創新,這是件好事。
題圖來源:視覺中國
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.