![]()
讓AI像人類一樣記憶,
這家公司如何拿下AI競賽的下半場(chǎng)門票。
前不久,LMArena.ai對(duì)全球大模型的市場(chǎng)地位變化做了統(tǒng)計(jì)后,得到了一個(gè)有意思的發(fā)現(xiàn):
自2023年年中起,SOTA模型的迭代周期被快速壓縮至35天,曾經(jīng)的SOTA模型,只要短短5個(gè)月就可能跌出Top5,7個(gè)月后連Top10的門檻都摸不到。
但SOTA不斷更新的背后,模型的確在進(jìn)步,但曾經(jīng)ChatGPT、Deepseek這樣讓人眼前一亮的新產(chǎn)品卻越來越少,技術(shù)進(jìn)步已經(jīng)進(jìn)入了不斷小修小補(bǔ)卻始終難以突破的瓶頸期。
與逐漸偃旗息鼓的模型進(jìn)化形成鮮明對(duì)比的,是過去兩年多圍繞AI記憶形成的你方唱罷我登場(chǎng)的熱鬧。
其中,最先一步出發(fā)的,是2023年先后涌現(xiàn)出的諸如Milvus、Pinecone、faiss為代表的向量數(shù)據(jù)庫產(chǎn)品。
此后一年,建立在成熟的語義、知識(shí)圖庫以及關(guān)鍵詞檢索基礎(chǔ)上,2024—2025年期間,Letta(MemGPT)、Mem0、MemU、MemOS為代表的各種AI記憶框架,如雨后春筍般冒出,GitHub上各種Mem“X”系產(chǎn)品,多到可以組成連連看。
熱鬧很快傳導(dǎo)至模型玩家陣營,一周前,Claude被爆要在Cowork中為模型增加記憶能力引發(fā)的討論尚未消退,谷歌又緊隨其后,宣布了最新的Nested Learning成果,模型會(huì)根據(jù)上下文推理的結(jié)果自動(dòng)修改參數(shù)實(shí)現(xiàn)模型記憶,再次引發(fā)行業(yè)嘩然。
而在場(chǎng)景側(cè),代碼補(bǔ)全、情感陪伴、智能客服……模型+記憶的黃金商業(yè)模式,市場(chǎng)正誕生出越來越多跑通PMF的細(xì)分爆款。順著這條線,紅熊AI在內(nèi),一些主打AI記憶科學(xué)解決方案商業(yè)的玩家,也隨之站到了聚光燈下,成為新的行業(yè)焦點(diǎn)。
記憶成為新的中場(chǎng)賽點(diǎn)已經(jīng)無可置疑。但關(guān)于如何給大模型加上記憶,如何讓模型更好地記憶,或許一直以來,行業(yè)都有三個(gè)誤解。
誤解一:
記憶=RAG+長上下文?
紅熊AI創(chuàng)始人溫德亮是行業(yè)老人了,但創(chuàng)業(yè)以來,每天都要應(yīng)對(duì)投資人與客戶的靈魂拷問:“你們的競爭對(duì)手是誰?”
問題看似普通,但回答起來,卻會(huì)讓人陷入兩難:說沒有對(duì)手像自大,說有對(duì)手又找不到真正對(duì)標(biāo)的玩家。
在2023—2024年AIinfra爆發(fā)期,RAG(檢索增強(qiáng)生成)技術(shù)一度成了AI記憶的代名詞。通過給模型外置一個(gè)向量數(shù)據(jù)庫,并存入各種企業(yè)的私有數(shù)據(jù)、專業(yè)文獻(xiàn),大模型便能掌握在模型訓(xùn)練階段沒有更新的信息,以及私有數(shù)據(jù)知識(shí)。
在那一時(shí)期,投資人看項(xiàng)目必問RAG性能,客戶選型必定先比檢索準(zhǔn)確率,仿佛只要疊加上下文窗口、檢索優(yōu)化算法,AI健忘的痛點(diǎn)就能被盡數(shù)解決。
一時(shí)之間,全球范圍內(nèi),做RAG框架的、做RAG解決方案的,以及更深一步做純私有化知識(shí)庫部署的團(tuán)隊(duì)如過江之鯽。飛書、釘釘、企業(yè)微信等巨頭可以靠著標(biāo)準(zhǔn)化以及數(shù)據(jù)沉淀做標(biāo)準(zhǔn)化,中小團(tuán)隊(duì)也能靠著私有化部署啃下一個(gè)又一個(gè)垂直場(chǎng)景。
但在商業(yè)中,一個(gè)認(rèn)知的共識(shí)程度越高,就說明它越正確,但也越說明這是個(gè)滯后變量。
RAG的思路沒有錯(cuò),但也會(huì)隨著技術(shù)的演進(jìn)而暴露出短板。2024年開始,溫德亮發(fā)現(xiàn),傳統(tǒng)RAG似乎被大家過度神話了。在落地過程中,有時(shí)候即使只是最基礎(chǔ)的知識(shí)庫項(xiàng)目,RAG也能以各種意想不到的姿勢(shì)撞墻:
比如在法律類項(xiàng)目,經(jīng)常會(huì)出現(xiàn)大量語義相似,但是實(shí)際適用范圍、判例天差地別的場(chǎng)景。具體來說,法條中,有很多決定適用邊界的關(guān)鍵細(xì)節(jié)(如合同解除需催告程序等),在語義層面權(quán)重極低,會(huì)被整體相似性掩蓋;此外,法律體系的運(yùn)行不是孤立的文本匹配,需要遵循上位法優(yōu)于下位法、特別法優(yōu)于一般法、新法優(yōu)于舊法等等約束,但面對(duì)類似的沖突條款,模型只按語義相似度排序,而非優(yōu)先匹配效力更高的法條,就會(huì)導(dǎo)致整體理解出現(xiàn)偏差。更不用說,法律場(chǎng)景中,檢索本身一定是綁定案由、主體、地域等結(jié)構(gòu)化場(chǎng)景信息,比如人身損害賠償相關(guān)法條,可能與適用于交通事故和醫(yī)療糾紛的子條款語義相近,但舉證責(zé)任、賠償標(biāo)準(zhǔn)截然不同,純語義檢索完全無法精準(zhǔn)區(qū)分適配場(chǎng)景。
難度再升級(jí),到了各種客服AI場(chǎng)景,即便針對(duì)場(chǎng)景做了定制化,把embedding、chunking、ranking全部做到盡善盡美,RAG方案依然會(huì)出現(xiàn):在每天重復(fù)回答“XX條款的適用場(chǎng)景是什么”“還款日期如何計(jì)算”這類問題時(shí),花費(fèi)不必要的檢索成本;而當(dāng)用戶跨會(huì)話咨詢時(shí),AI更是像換了個(gè)人,完全不記得上一輪的溝通細(xì)節(jié)。
溫德亮很快意識(shí)到:基于語義檢索的RAG方案只能解決不到60%的真實(shí)需求,而客戶要的是完整場(chǎng)景化解決方案,能夠?qū)崿F(xiàn)一次咨詢、終身記憶,并且動(dòng)態(tài)更新知識(shí)。
RAG作為一種被動(dòng)的檢索工具,它的存在就像給AI裝了本外置詞典,能解決不知道的問題,卻解決不了記不住的核心矛盾。與此同時(shí),在寫入側(cè),RAG通常也只能以周為單位做離線的數(shù)據(jù)更新,無法實(shí)時(shí)動(dòng)態(tài)地寫入用戶的即時(shí)會(huì)話內(nèi)容與關(guān)注重點(diǎn)。
在此基礎(chǔ)上,跨會(huì)話記憶丟失、信息無法動(dòng)態(tài)沉淀、不會(huì)主動(dòng)關(guān)聯(lián)經(jīng)驗(yàn),這些都是RAG的能力盲區(qū)。
也是因此,在他看來,真正的AI記憶,必須復(fù)刻人腦的工作邏輯,能短期記得住,長期有常識(shí),判斷有感情。
具體來說,人腦處理信息要經(jīng)過編碼、存儲(chǔ)、提取三大環(huán)節(jié):外界信息會(huì)經(jīng)感覺皮層轉(zhuǎn)化為神經(jīng)信號(hào),由前額葉篩選后傳入海馬體,再與既有知識(shí)網(wǎng)絡(luò)整合,最終按重要性存入大腦皮層;提取時(shí)則由海馬體聯(lián)動(dòng)對(duì)應(yīng)區(qū)域激活記憶。
這是一套動(dòng)態(tài)、實(shí)時(shí)、可寫入可檢索的智能系統(tǒng),不僅解決了知道的問題,也讓“知道”本身內(nèi)化成為認(rèn)知與思考邏輯的一部分,優(yōu)化后續(xù)的思考、判斷與行為。
借鑒這套人腦的記憶-思維邏輯,紅熊AI據(jù)此打造了完整的記憶科學(xué)體系,并在今年1月推出記憶熊v0.2.0,把AI記憶拆解為顯性記憶、隱性記憶、聯(lián)想記憶以及動(dòng)態(tài)進(jìn)化記憶,不同層之間通過智能算法動(dòng)態(tài)流轉(zhuǎn)、在不同場(chǎng)合以不同的方式使用。
更關(guān)鍵的是,這套體系不止于讀、寫、存,還為記憶本身加入了情感加權(quán)、智能遺忘、跨智能體協(xié)同等能力,從底層重構(gòu)了AI記憶的邏輯。如此一來,不僅解決了存儲(chǔ)數(shù)據(jù)量爆炸,帶來成本飆升、上下文過長的問題,也為不同的記憶賦予不同的權(quán)重,從而讓記憶的利用變得更加高效。
誤解二:
事實(shí)檢索重于一切?
情商才能更好解決問題
解決了整體記憶體系架構(gòu)如何搭建的問題之后,紅熊AI的核心研發(fā)團(tuán)隊(duì)和所有技術(shù)團(tuán)隊(duì)一樣,開始把準(zhǔn)確率當(dāng)作記憶系統(tǒng)的唯一KPI。
團(tuán)隊(duì)里做工程與研發(fā)的同事占據(jù)多數(shù),其中理工背景的男生又占據(jù)了大半,如此配置,最大的優(yōu)點(diǎn)是大家都有共同話語體系、思維能力強(qiáng),在金融風(fēng)控、技術(shù)運(yùn)維等場(chǎng)景,這套邏輯可以跑得非常順。畢竟,這些場(chǎng)景中,事實(shí)優(yōu)先,錯(cuò)一個(gè)數(shù)字都可能引發(fā)無法預(yù)知的風(fēng)險(xiǎn)。
但這么做的不足則在于:不分場(chǎng)合的過度坦誠與邏輯推理,本質(zhì)上就是冷漠與對(duì)抗的代名詞。
讓所有人意識(shí)到這一點(diǎn)的,是一個(gè)意外的客戶需求。
2025年,某發(fā)達(dá)省份婦聯(lián)找到了紅熊AI團(tuán)隊(duì),表示他們希望用AI承接深夜情感咨詢、家庭糾紛求助。
梳理用戶需求時(shí),團(tuán)隊(duì)很快發(fā)現(xiàn),那些深夜的來訪者,他們的煩惱有時(shí)是非常瑣碎、具體,卻沒有標(biāo)準(zhǔn)解決答案的,甚至用戶來訪時(shí),自己已經(jīng)有了判斷,只是需要一點(diǎn)來自外界的肯定與鼓勵(lì)。在這種場(chǎng)景中,用戶不需要也不存在所謂的精準(zhǔn)事實(shí)答案,他們需要的是被理解、被安撫、被肯定。比如,新用戶來電時(shí),AI要快速識(shí)別情緒波動(dòng),引導(dǎo)他們情緒的宣泄;老用戶回訪時(shí),要記得他們上次的困擾以及怎樣的安撫最為有效。
總而言之,犯錯(cuò)要先道歉,情感困擾要先贊同理解共情,這些人類處事的情商準(zhǔn)則,AI落地也同樣需要熟練掌握。
這也倒逼紅熊AI攻克了記憶系統(tǒng)的情感難題:
通過給每段記憶貼上情感權(quán)重標(biāo)簽,可以從多維度量化用戶情緒。比如,文本場(chǎng)景中,我們可以通過負(fù)面/正面詞匯密度、句式(反問句、感嘆句)、情緒強(qiáng)度詞(“極其”“再也不”)綜合算出0-100分的情感分?jǐn)?shù);語音場(chǎng)景中,則需要疊加語速、語調(diào)、停頓、音量特征校準(zhǔn);多模態(tài)場(chǎng)景,還可以再加入面部表情識(shí)別,讓量化更精準(zhǔn)。
就如同朋友失戀了,我們需要先給對(duì)方一個(gè)擁抱,而不是追根究底分手原因做情感判官。對(duì)AI落地來說,情感權(quán)重不僅會(huì)決定記憶的優(yōu)先級(jí),更影響AI的回應(yīng)邏輯。比如在紅熊AI的產(chǎn)品中,如果用戶上個(gè)月因物流延遲給出90分負(fù)面評(píng)價(jià),那么這段記憶需要被存入長期記憶并貼上高負(fù)面標(biāo)簽。當(dāng)用戶本月再次詢問貨什么時(shí)候到,AI不能只機(jī)械回復(fù)物流在途,而是先安撫“抱歉之前讓你等久了,我?guī)湍悴榱藢?shí)時(shí)物流,馬上就能到”,再同步事實(shí)信息。
誤解三:
Agent的未來是標(biāo)準(zhǔn)化?
非標(biāo)才是行業(yè)宿命
今年年初,Manus的爆火與并購進(jìn)度,一度讓整個(gè)Agent賽道陷入狂歡。一時(shí)之間,復(fù)刻下一個(gè)Manus,做to B的Manus,成為了行業(yè)最熱門的議題。
資本在等待超級(jí)Agent的誕生,用戶也期待用一套產(chǎn)品,解決不同場(chǎng)景中的所有問題。但在大廠打過工,又在SaaS公司做過CTO,如今在自己創(chuàng)業(yè)的溫德亮腦海中一直有一個(gè)問號(hào):agent的市場(chǎng)盤子的確很大,但真的能出現(xiàn)所謂的超級(jí)贏家嗎?
或許一個(gè)有些掃興的結(jié)論是,agent類產(chǎn)品的宿命,在革命SaaS,但也必須走上SaaS的老路。
革命SaaS的邏輯在于:記憶與工具的加持,讓Agent開發(fā)門檻大幅降低,從而針對(duì)每一個(gè)特殊場(chǎng)景提出針對(duì)性的解決方案,進(jìn)而瓦解傳統(tǒng)SaaS的場(chǎng)景壁壘。
而與這種無限細(xì)分的天然優(yōu)勢(shì)相伴隨的,必定是傳統(tǒng)中國SaaS的非標(biāo)碎片化詛咒。在實(shí)際開發(fā)中,溫德亮意識(shí)到,沒有一套標(biāo)準(zhǔn)化記憶系統(tǒng)能適配所有行業(yè),甚至同一行業(yè)的不同品類都要差異化定制。哪怕都是電商銷售百貨,賣手機(jī)殼的商家和賣手套的商家,前者關(guān)注材質(zhì)、圖案,后者側(cè)重尺碼、舒適度,關(guān)鍵詞不同,記憶規(guī)則的制定也要有所區(qū)別。
到了情商的使用與落地,不同行業(yè)的情感權(quán)重占比更是天差地別。紅熊AI摸索出一套行業(yè)規(guī)則:售后客服、教育場(chǎng)景情感權(quán)重占40%—50%,必須優(yōu)先安撫情緒;醫(yī)療、金融風(fēng)控場(chǎng)景情商的需求僅占10%—20%,事實(shí)優(yōu)先;通用陪伴場(chǎng)景占20%—30%,貼合心情即可。這都需要漫長的行業(yè)摸索。
在這一背景下,紅熊AI必須在做好標(biāo)準(zhǔn)化能力的基礎(chǔ)上,接受在解決方案環(huán)節(jié)的非標(biāo)、苦生意的宿命,
首先是共性能力建設(shè)。
盡管,不同客戶的數(shù)據(jù)來源、數(shù)據(jù)處理流程,以及對(duì)記憶的需求模式不盡相同,但行業(yè)的長期趨勢(shì)是多agent協(xié)作、大模型將越來越多地利用起企業(yè)的多模態(tài)數(shù)據(jù),這卻是共同的大趨勢(shì)。
也是因此,在記憶熊v0.2.0中,紅熊AI強(qiáng)化了其集群化Agent記憶協(xié)同能力,通過引入統(tǒng)一記憶中樞(Memory Hub),可以實(shí)現(xiàn)多Agent間的最小化、按需式記憶共享,解決傳統(tǒng)多Agent系統(tǒng)的記憶冗余、沖突問題。并同時(shí)支持主管模式(集中管控流水線任務(wù))和協(xié)作模式(去中心化復(fù)雜決策),適配不同場(chǎng)景的智能體組織形態(tài)。
而針對(duì)多模態(tài)數(shù)據(jù)的處理需求,在知識(shí)庫層面,紅熊AI則推出了三大解析引擎(DeepDoc深度解析、MinerU智能提取、TextIn快速解析)實(shí)現(xiàn)100%版面還原,支持PPTX高保真解析、音視頻以文搜音,并通過向量+圖譜雙驅(qū)動(dòng)檢索,將多跳推理準(zhǔn)確率提升至92.5%。
![]()
基于以上共性的能力建設(shè),非標(biāo)的環(huán)節(jié),則集中于行業(yè)詞匯庫積累、知識(shí)圖譜打造這樣的行業(yè)解決方案打造。
紅熊AI旗下記憶熊的產(chǎn)品設(shè)計(jì)結(jié)構(gòu),我們可以理解為,產(chǎn)品頂層是一個(gè)由小模型不斷根據(jù)用戶輸入做動(dòng)態(tài)調(diào)整的類似graph的知識(shí)圖譜結(jié)構(gòu),類似導(dǎo)航圖,向下則是不同的數(shù)據(jù)庫組成的記憶管理模塊。
其中頂層的graph打造,是一個(gè)需要一個(gè)細(xì)分行業(yè)一個(gè)細(xì)分行業(yè)去硬啃的過程。首次拓展新的品類客戶,前期與客戶共建,做文檔以及知識(shí)梳理就需要花掉幾周的時(shí)間,此后,用戶的數(shù)據(jù)處理,也需要消耗整體25%上下的成本。
![]()
在這個(gè)過程中,也需要團(tuán)隊(duì)去不斷學(xué)習(xí)與積累不同行業(yè)的知識(shí):比如醫(yī)療行業(yè)的負(fù)面詞不是“不滿意”,而是“疼痛、過敏、并發(fā)癥”;金融行業(yè)的核心詞是“平倉、建倉、凈值”,需優(yōu)先記憶;制造業(yè)的“故障、停機(jī)”則要強(qiáng)制存入長期記憶。
但另一個(gè)角度來看,這種前期開拓的非標(biāo)準(zhǔn)化以及緩慢,又會(huì)成為企業(yè)先發(fā)優(yōu)勢(shì)的由來。
過去十多年中,SaaS的成長路徑,往往遵循一個(gè)細(xì)分領(lǐng)域拿下燈塔客戶-沉淀出細(xì)分行業(yè)解決方案-全行業(yè)拓展的規(guī)律,其標(biāo)準(zhǔn)化程度雖然遠(yuǎn)不及互聯(lián)網(wǎng),但企業(yè)的核心壁壘也正是在于這種細(xì)分行業(yè)認(rèn)知的沉淀。
針對(duì)不同行業(yè)的記憶打造同樣如此,有了前期解決方案的不斷細(xì)分,才會(huì)有后來的生態(tài)效應(yīng)與know how積累。
尾聲
進(jìn)入2026年,大模型的敘事,正從scaling law為核心的參數(shù)閃電戰(zhàn),切換至記憶為主導(dǎo)的馬拉松式下半場(chǎng)。
而在大模型的下半場(chǎng),記憶能力已經(jīng)成為拉開不同模型,不同agent表現(xiàn)的核心來源。圍繞這一套敘事邏輯,參與的玩家,既有模型廠、框架玩家這樣的上游infra玩家,也有紅熊AI在內(nèi)這樣的專業(yè)解決方案商。
這個(gè)過程,不如曾經(jīng)的百模大戰(zhàn)一樣的高舉高打,也注定不會(huì)像百模大戰(zhàn)一樣快速地決出階段性的贏家,給出所謂的標(biāo)準(zhǔn)答案。
但動(dòng)物有了個(gè)體的記憶,才會(huì)有更好的生存;人類有了族群的記憶才有了文明;而記憶之于AI,或許正是新一輪產(chǎn)業(yè)進(jìn)化的起點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.