OpenAI 發布了一份名為《AI in the Enterprise》的報告,內容非常充實,包括如何將 AI 引入工作,AI 如何重塑新一代工作模式,AI 如何解鎖開發者能力,以及如何評估,微調模型。分享了與 7 家“前沿公司”合作的經驗教訓。不僅僅有技術展示,更有實打實的落地策略。第一時間啃完這份報告,給大家劃個重點
地址:
https://cdn.openai.com/business-guides-and-resources/ai-in-the-enterprise.pdf
OpenAI 觀察到,AI 正在三大前線為企業帶來顯著、可衡量的改進:
一是提升員工效能 (Workforce performance),讓員工在更短時間內,產出更高質量的工作成果;
二是自動化日常運營 (Automating routine operations),把人從重復性工作中解放出來,聚焦高價值任務;
三是賦能產品創新 (Powering products),提供更相關、更快速響應的客戶體驗。
但要注意,用 AI 跟搞傳統軟件或云應用不是一回事。成功的公司往往把它視為一種新范式,擁抱實驗心態和迭代方法,這樣才能更快看到價值,并獲得用戶和決策者的支持
OpenAI 自身也采用迭代開發 (iterative development)的方式,快速部署、獲取反饋、持續改進模型性能和安全性。這意味著,合作企業能更早用上新技術,并且他們的反饋會直接影響 AI 的未來形態
七大核心經驗:來自前沿企業的實戰真經
報告總結了 7 條關鍵經驗,每條都配有具體案例,干貨滿滿:
Lesson 1: 從評估 (Evals) 開始,確保質量與安全
核心思想:在投入生產前,必須用系統化的評估流程來衡量 AI 模型在具體場景下的表現。這不僅是“測驗”,更是持續改進的基礎。
案例:摩根士丹利 (Morgan Stanley)
場景:金融服務,高度敏感和個性化。核心訴求是提升財務顧問效率
做法:對每個 AI 應用進行嚴格評估 (evals),具體包括評估語言翻譯的準確性和質量;評估內容摘要的準確性、相關性和連貫性;以及將 AI 輸出與人類專家對比,評判準確性和相關性
效果:98% 的顧問每天使用 OpenAI;文檔信息獲取率從 20% 躍升至 80%,搜索時間大幅縮短;顧問有更多時間維護客戶關系,過去需要幾天的跟進,現在幾小時內完成
什么是 Evals?這是一個驗證和測試模型輸出的過程。嚴謹的 Evals 能確保應用穩定可靠,更能抵抗變化。它圍繞具體任務,對照基準(如準確度、合規性、安全性)來衡量模型輸出質量
Lesson 2: 將 AI 嵌入產品,創造新體驗
核心思想:利用 AI 處理海量數據、自動化繁瑣任務,從而創造更人性化、個性化的客戶體驗。
案例:Indeed (全球最大招聘網站)
場景:優化職位匹配,提升用戶體驗
做法:使用 GPT-4o mini 模型,不僅推薦職位,更重要的是向求職者解釋“為什么”這個職位適合他。AI 分析候選人背景和經驗,生成個性化的“邀請申請 (Invite to Apply)”理由
效果:對比舊引擎,新版職位申請發起率提升 20%,下游成功率(雇主更傾向于雇傭)提升 13%。考慮到 Indeed 每月發送超 2000 萬條信息、擁有 3.5 億月活用戶,這個提升的商業影響巨大
優化:為控制成本和提高效率(因為調用量大),OpenAI 協助 Indeed 微調了一個更小的 GPT 模型,在減少 60% token 消耗的情況下,達到了相似的效果。
Lesson 3: 立刻行動,盡早投資,享受復利
核心思想:AI 不是即插即用的方案,其價值通過迭代不斷增長。越早開始,組織從“知識復利”中獲益越多。
案例:Klarna (全球支付與購物平臺)
場景:優化客戶服務
做法:引入 AI 客服助手。通過持續測試和優化,幾個月內,AI 處理了三分之二的客服聊天,相當于數百名人工坐席的工作量,平均解決時間從 11 分鐘縮短到 2 分鐘
效果:預計帶來4000 萬美元的利潤提升,同時客戶滿意度與人工客服持平。更重要的是,90% 的 Klarna 員工在日常工作中使用 AI,全員對 AI 的熟悉加速了內部創新和客戶體驗的持續優化,AI 的效益在整個業務中實現了“復利增長”
Lesson 4: 定制與微調 (Fine-tune) 模型,釋放特定價值
核心思想:針對特定業務數據和需求定制或微調模型,能顯著提升 AI 應用的價值。
案例:Lowe's (家得寶)
場景:改善電商平臺的商品搜索準確性和相關性
挑戰:供應商眾多,產品數據不完整或不一致
做法:與 OpenAI 合作,微調 (fine-tuning) 模型。這不僅需要準確的產品描述和標簽,還需要理解不同品類下消費者搜索行為的動態變化
效果:產品標簽準確率提升 20%,錯誤檢測能力提升 60%
什么是 Fine-tuning?如果說 GPT 模型是“成衣”,那微調就是“量身定制”。用你獨有的數據(如產品目錄、內部 FAQ)訓練模型,讓它更懂你的業務術語、風格和場景,輸出更相關、更符合品牌調性的結果,同時減少人工編輯和核對,提升效率
Lesson 5: 把 AI 交到一線專家手中
核心思想:最了解業務流程和痛點的人,往往最能找到 AI 的用武之地。讓一線專家直接使用 AI,比構建通用方案更有效。
案例:BBVA (西班牙對外銀行)
場景:在全球超過 12.5 萬員工中推廣 AI 應用
做法:與法務、合規、IT 安全團隊緊密合作,確保負責任使用的前提下,在全球范圍內部署了 ChatGPT Enterprise。然后,鼓勵員工自行探索應用場景,創建定制化的 GPTs (Custom GPTs)
效果:5 個月內,員工創建了超過2900 個定制 GPTs,將許多項目和流程的時間線從幾周縮短到幾小時。應用遍及多個領域:信貸風險團隊用它更快更準地評估信用;法務團隊用它每年回答 4 萬個關于政策、合規等問題;客戶服務團隊則用它自動化 NPS 調研的情感分析。AI 的成功應用已擴展到市場、風險管理、運營等更多領域
Lesson 6: 為開發者“松綁”,加速創新
核心思想:開發者資源是許多組織的創新瓶頸。利用 AI 構建開發平臺層,可以統一和加速 AI 應用的構建。
案例:Mercado Libre (拉美最大電商和金融科技公司)
場景:解決工程團隊不堪重負、創新緩慢的問題
做法:與 OpenAI 合作,基于 GPT-4o 和 GPT-4o mini 構建了一個名為 "Verdi" 的開發平臺層。該平臺整合了語言模型、Python 節點和 API,以自然語言為核心交互方式,幫助其1.7 萬名開發者更快、更一致地構建高質量 AI 應用,而無需深入源代碼。安全、護欄和路由邏輯都內置其中
效果:AI 應用開發顯著加速,賦能多項業務,例如通過 GPT-4o mini Vision 提升庫存能力 100 倍;將欺詐檢測準確率提高到近 99%;定制化產品描述以適應不同方言;通過自動化評論摘要增加訂單;并個性化通知以提高參與度
未來:計劃用 Verdi 優化物流,減少延遲交付,并在全組織內承擔更多高影響力任務
Lesson 7: 設定大膽的自動化目標
核心思想:許多流程中都存在大量重復性工作,是自動化的沃土。不要滿足于低效現狀,要敢于設定高遠目標。
案例:OpenAI 自身
場景:內部支持團隊耗費大量時間在訪問系統、理解問題、撰寫回復和執行操作上
做法:構建了一個內部自動化平臺,疊加在現有工作流和系統之上,自動化重復工作,加速洞察和行動。首個用例是在 Gmail 之上工作,自動起草客戶回復并觸發后續動作(如訪問客戶數據、知識庫,更新賬戶,創建工單)
效果:該平臺每月處理數十萬個任務,釋放人力從事更高價值的工作。該系統正推廣到其他部門。
這些案例的共同點是:開放、實驗的心態,嚴謹的評估,以及安全護欄。成功的企業并非一蹴而就地將 AI 注入所有流程,而是先聚焦高回報、低門檻的場景,通過迭代學習,再將經驗推廣到新領域
結果顯而易見:更快的流程、更高的準確性、更個性化的體驗,以及更有價值感的工作。
OpenAI 還觀察到新趨勢:企業開始集成 AI 工作流,利用工具、資源和智能體 (Agents)來自動化日益復雜的流程。報告中提到了Operator,能自主瀏覽網頁、點擊按鈕、填寫表單、跨系統工作的“虛擬員工”,無需定制集成或 API,就能實現端到端的自動化。例如:自動化軟件測試和 QA,像真實用戶一樣交互并標記 UI 問題;以及在沒有技術指令或 API 連接的情況下,代表用戶更新記錄系統
希望 OpenAI 分享的這些經驗,能給你帶來一些啟發
參考:
https://cdn.openai.com/business-guides-and-resources/ai-in-the-enterprise.pdf
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.