大模型無(wú)限記憶外掛來(lái)了!
supermemory 公司剛剛發(fā)布 Infinite Chat API,能讓任何 LLM 都具有近乎無(wú)限的上下文長(zhǎng)度
用戶只需一行代碼即可切換到該 API
核心痛點(diǎn):LLMs的上下文“天花板”
我們都知道,現(xiàn)有的大模型在處理超過(guò)2萬(wàn)Token(甚至更少)的長(zhǎng)文本時(shí),性能往往會(huì)顯著下降,出現(xiàn)“失憶”、理解偏差等問(wèn)題。這極大地限制了它們?cè)谛枰志糜洃浐蜕疃壬舷挛睦斫鈭?chǎng)景下的應(yīng)用
Supermemoryai的解決方案:Infinite Chat API
Supermemoryai剛剛推出的Infinite Chat API,聲稱能完美解決這一難題
它的核心功能簡(jiǎn)單粗暴:
? 擴(kuò)展任何大模型的上下文長(zhǎng)度
? 同時(shí),幫你節(jié)省高達(dá)90%的Token消耗和成本
? 還能提升模型的響應(yīng)性能
官方解釋,Infinite Chat API充當(dāng)了你的應(yīng)用程序和LLM之間的一個(gè)透明代理。它會(huì)智能地維護(hù)對(duì)話上下文,只將當(dāng)前交互最需要的關(guān)鍵信息精準(zhǔn)地發(fā)送給LLM
本質(zhì)上是對(duì)溢出的先前上下文進(jìn)行RAG(檢索增強(qiáng)生成)處理
集成便捷:“一行代碼即可切換”,對(duì)現(xiàn)有應(yīng)用改動(dòng)極小
即刻可用:已經(jīng)上線,可以馬上試用
價(jià)格:
?免費(fèi)上手:提供免費(fèi)試用額度
? 固定費(fèi)用:試用期后,每月20美元固定費(fèi)用
? 用量計(jì)費(fèi):在每個(gè)對(duì)話線程中,前2萬(wàn)Token免費(fèi),超出部分按每百萬(wàn)Token 1美元計(jì)費(fèi)
感興趣的朋友,可以去官網(wǎng)體驗(yàn)Demo和查閱文檔:
Demo體驗(yàn):
https://supermemory.chat
官方文檔:
https://docs.supermemory.ai/infinite-chat
?星標(biāo)AI寒武紀(jì),好內(nèi)容不錯(cuò)過(guò)?
用你的贊和在看告訴我~
求贊
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.