本文來源:時代周報 作者:郭儒逸
![]()
AI將在多大程度上重塑科學研究(AI for Science)?這是沁言學術(shù)CEO羅實一直在思考的問題。
2024年的諾貝爾化學獎頒給了利用AI模型輔助研究的科學家,這一標志性事件讓“AI科研”徹底出圈。而早在風口來臨之前,羅實及其團隊就已扎進這一賽道。作為一名畢業(yè)于清華大學的互聯(lián)網(wǎng)連續(xù)創(chuàng)業(yè)者,羅實從技術(shù)變革中嗅到了商業(yè)機會。
“傳統(tǒng)科研中,文獻檢索、引用插入、格式調(diào)整等機械性工作占據(jù)了學者大量時間,我們希望把他們從繁瑣中解放出來。”近日羅實在接受時代周報記者專訪時直言,沁言學術(shù)的目標并非做一個簡單的效率工具,而是打造一個真正懂科研邏輯、能輔助深度思考的“學術(shù)超級智能體”。
在他看來,國內(nèi)外已陸續(xù)出現(xiàn)類似產(chǎn)品,現(xiàn)在已處于學術(shù)智能體爆發(fā)的前夜。無論是深勢科技等硬科技企業(yè)的持續(xù)加碼,還是各類新興產(chǎn)品的跟進,都標志著“AI賦能科研”正在從共識走向競爭。而在羅實眼中,這并非一場零和博弈,不同技術(shù)路線的產(chǎn)品將在龐大的科研生態(tài)中找到各自的土壤,而沁言學術(shù)要做的,就是守住“深耕科研場景”這一高地。
2025年6月,沁言學術(shù)由其經(jīng)典產(chǎn)品“邊寫邊搜”完成品牌迭代,核心團隊匯聚了CSSCI創(chuàng)始人、清華學霸及互聯(lián)網(wǎng)大廠極客,產(chǎn)品已服務(wù)超20萬C端科研用戶。
業(yè)內(nèi)人士普遍認為,AI將重塑傳統(tǒng)的學術(shù)研究范式。毫無疑問,這是一項野心勃勃的計劃。“我們的產(chǎn)品定位,并不是要取代學術(shù)人群,而是希望為他們提質(zhì)增效,為每名學者提供專屬的AI研究伙伴。”羅實表示,沁言學術(shù)并不是幫助用戶直接寫一篇論文,然后拿去投稿,“我們嚴守學術(shù)倫理底線,不幫用戶‘寫’論文,而是構(gòu)建一個專屬的AI科研伙伴。”
行業(yè)格局:“真正的巨頭尚未成型”
時代周報:沁言學術(shù)目前發(fā)展情況如何?
羅實:現(xiàn)在核心團隊有30多人,幾名發(fā)起人包括CSSCI創(chuàng)建者蘇新寧教授都是長期深耕學術(shù)領(lǐng)域的專家;產(chǎn)研團隊則來自清華大學、悉尼大學、北卡羅來納州立大學、華南理工等名校,擁有華為、阿里、小米等大廠的實戰(zhàn)背景,在產(chǎn)品創(chuàng)新和落地方面經(jīng)驗深厚。從去年起,我們針對AI在學術(shù)領(lǐng)域的落地做了大量探索。現(xiàn)在主推的“學術(shù)超級智能體”,正處在市場推廣階段。
時代周報:公司之前有“邊寫邊搜”這款產(chǎn)品,也是幫助用戶解決學術(shù)流程問題。學術(shù)智能體和它有什么區(qū)別?
羅實:“邊寫邊搜”可以理解為沁言學術(shù)的1.0版本,這是一款相對比較傳統(tǒng)的工具,提供文獻管理或文獻閱讀等功能,為我們積累了高質(zhì)量的學術(shù)數(shù)據(jù)資源。而現(xiàn)在的“學術(shù)智能體”是用AI重構(gòu)了整個科研工作流——從最上游的AI輔助選題,到中游的知識庫構(gòu)建,再到下游的寫作輔助。以前我們是給學術(shù)工作者一把好用的鏟子,現(xiàn)在我們是提供了一個智能化的施工團隊。
時代周報:不少通用大模型也可以輔助學術(shù)寫作。和它們相比,沁言學術(shù)有什么不同?
羅實:通用大模型最大的問題是“學術(shù)幻覺”,它可能會一本正經(jīng)地胡說八道。而我們的核心壁壘在于“私有知識庫+精準溯源”。這個知識庫可以把用戶研究方向收集而來的文獻,以及閱讀文獻時做的摘要筆記融合起來。當需要生成一個大綱或內(nèi)容時,可根據(jù)這些已驗證過的文獻、筆記,快速輸出結(jié)果。
我們的生成是“基于證據(jù)”的(Evidence-based),每一句話、每一個觀點都能精準錨定到具體的文獻來源——摘要、作者、年份一目了然。這種嚴謹性是通用模型無法比擬的。此外,相比通用模型的整篇生成,我們輔助寫作提供的是顆粒度更細的“局部優(yōu)化”,讓學者擁有更多掌控權(quán)。
產(chǎn)品邏輯:“讓AI處理信息,讓人類處理思想”
時代周報:寫論文時,文獻引用也是工作量很大的環(huán)節(jié),沁言學術(shù)怎么解決這個問題?
羅實:我們的輔助寫作功能,確實希望在這方面幫到用戶。
比如一篇博士論文,通常需要上百個文獻引用來支撐核心觀點。這是一個很繁瑣的工作。
沁言學術(shù)可以把用戶搜集的文獻存到知識庫,通過知識庫與寫作流程的打通,能自動匹配觀點與文獻,將原本需要一兩天的工作壓縮至5分鐘。我們不是在炫技,而是在通過極致的效率提升,讓學者將寶貴的時間投入到更有價值的創(chuàng)造性工作中。
時代周報:行業(yè)里其他的學術(shù)智能體,能不能做到這些?
羅實:現(xiàn)在針對科研領(lǐng)域的AI應(yīng)用不少,國外有一些月活達到幾百萬量級的產(chǎn)品,國內(nèi)也有不少入局者,但大多局限在文獻檢索或單純的對話生成等單一環(huán)節(jié)。能真正打通“檢索-閱讀-管理-寫作”全鏈路,且達到一定用戶量級的產(chǎn)品,目前國內(nèi)尚未形成頭部壟斷的產(chǎn)品。賽道的終局遠未到來,這正是沁言學術(shù)的戰(zhàn)略機遇窗口。我們要做的是全流程的生態(tài)覆蓋,而非單點的工具修補。
時代周報:對用戶來說,能一站式解決問題的產(chǎn)品當然要便捷得多。
羅實:是的。比如寫一篇論文,在傳統(tǒng)的文獻檢索方式下,用戶需要用不同的關(guān)鍵詞去不同的數(shù)據(jù)庫檢索,如知網(wǎng)、萬方和Google Scholar等。檢索之后,要從幾百篇當中做初步篩選,最終集中到幾十篇。
然后再做精讀,而后再篩選。到了寫作環(huán)節(jié),還要不停重復檢索。如果只針對某個環(huán)節(jié)做產(chǎn)品,這是不夠的。
時代周報:沁言學術(shù)的學術(shù)智能體,怎么把這一過程簡化?
羅實:你可以把需求——也就是模糊的研究意圖,一次性都告訴學術(shù)智能體。比如“近五年某領(lǐng)域某學者的研究綜述”。智能體不僅能自動檢索篩選,下載至AI云盤,還能自動完成預讀和摘要。
接下來的精讀,如果使用ChatGPT等通用大模型去讀,那要一篇篇把文獻丟給它。但打開沁言學術(shù)的AI云盤,下載的文獻會自動完成大致閱讀和概括,甚至還會提出一些研究問題的建議。你可以快速就某篇論文展開對話,智能體還能夠結(jié)合云盤里的其他文獻來回答問題。
總之,你用這個智能體的時間越久,智能體積累你的研究和思考越多。準確地說,它構(gòu)建的是屬于你的“科研第二大腦”。在這個“外腦”里,它利用通用的邏輯分析能力結(jié)合你專屬知識庫,幫你把那些費時費力找資料、讀文獻的工作都做好,讓你能騰出手來,專注于最核心的深度思考,更高效地完成個性化研究。
時代周報:有更多的數(shù)據(jù)去訓練,智能體的表現(xiàn)會更好?
羅實:想讓一個大模型的回答更專業(yè),其實有兩種方式。一種是訓練,通過構(gòu)造足夠好的數(shù)據(jù)集,基于這個數(shù)據(jù)集去做訓練,把外部知識逐漸內(nèi)化。第二種像沁言學術(shù)的產(chǎn)品,是基于知識庫,結(jié)合運用上下文信息和各種工具達到目標。
這是一個基于RAG(檢索增強生成)的復合流程:系統(tǒng)會率先穿透用戶的私有知識庫,并實時聚合全網(wǎng)最新的學術(shù)數(shù)據(jù)庫信息,經(jīng)結(jié)構(gòu)化清洗后投喂給大模型,最終生成高置信度的答案。
時代周報:沁言學術(shù)智能體使用的哪一款底層大模型?
羅實:目前我們的底層大模型,集成了市面上主流大模型的功能,國內(nèi)和國外的都有。每個大模型的特點不同,智能體綜合了它們的優(yōu)點,比如有的擅長偏創(chuàng)意的創(chuàng)作,有的多模態(tài)處理能力強,有的在長文寫作上表現(xiàn)更好,有的推理能力更強。我們會做一個融合。
技術(shù)與倫理:“底線是不觸碰學術(shù)不端”
時代周報:按沁言學術(shù)的產(chǎn)品邏輯,專業(yè)知識庫非常重要,它是如何構(gòu)建的?
羅實:準確地說,應(yīng)該是私有知識庫。
學術(shù)人群的文獻管理會涉及很多文獻,他們還會做摘錄和筆記。比如我們有個用戶,他做了大概5000多條筆記。按傳統(tǒng)的學術(shù)研究方式,可能需要用戶去打上各種各樣的標簽,方便使用時檢索。但我們的知識庫,是把知識切片放到一個數(shù)據(jù)庫里面。當用戶對話時,會自動檢索與上下文語義類似的內(nèi)容并輸出答案。這就相當于為他建設(shè)了一個私有知識庫。
另外,我們正開發(fā)一個“知識廣場”的功能,行業(yè)專家可以選擇共享知識。用戶在輔助寫作過程中,就可以把別人的知識庫掛載到自己的對話中來。
時代周報:沁言學術(shù)是否考慮自己做一個官方知識庫?
羅實:學術(shù)領(lǐng)域細分方向很多,我們自己真正專業(yè)和深入了解的,是計算機或AI相關(guān)領(lǐng)域。這方面的知識庫可能會做。
不過,針對完全不熟悉的領(lǐng)域,就需要與外部合作,比如學校、醫(yī)院或者科研機構(gòu)。我認為,無論建私有知識庫還是公共知識庫,前提是做好底層的基礎(chǔ)設(shè)施。這套東西是都需要的。
時代周報:上面提到訪問外部數(shù)據(jù)庫,可以全文下載文獻嗎,有沒有版權(quán)風險?
羅實:我們目前對接的外部數(shù)據(jù)庫,是偏公域和開源的類型。比如通過某些平臺下載文獻,是沒有版權(quán)問題的。我們正與國內(nèi)多家主流學術(shù)數(shù)據(jù)庫推進商業(yè)授權(quán)合作,致力于在合規(guī)框架下為用戶提供文獻獲取服務(wù)。
用戶在使用我們的智能體時,下載付費文獻會扣除相應(yīng)的“沁點”,也就是內(nèi)部“貨幣”。沁言學術(shù)再和外部數(shù)據(jù)庫按比例分成。
時代周報:做學術(shù)智能體,通常會調(diào)用各種外部工具,這方面進展如何?
羅實:我覺得一個很大的挑戰(zhàn)是,智能體在接到一項任務(wù)時,需要準確理解用戶意圖和工具本身可提供的服務(wù),就是意圖和能力之間的匹配。大模型和工具之間的連接,需要不斷完善。
除此之外,我們考慮把一部分構(gòu)建工具的能力,交給第三方去做。因為學術(shù)領(lǐng)域很廣,不太可能覆蓋所有領(lǐng)域,僅靠自己是不行的。第三方搭建工具平臺或插件平臺,我們做好接入,供智能體做任務(wù)過程中去調(diào)用。這有助于解決智能體對不同領(lǐng)域的工具調(diào)用問題。
時代周報:提到不同學術(shù)領(lǐng)域,是不是涉及到很多公式或圖表的學科,學術(shù)智能體應(yīng)對起來更麻煩一些?
羅實: 我們需要把學科分為兩類來看。對于數(shù)學、理論物理這類“數(shù)據(jù)密集型”或“文獻密集型”學科,通用大模型通過概率預測機制(Next Token Prediction),已經(jīng)能很好地處理復雜的公式推導和邏輯驗證,這部分能力進化極快。
真正的挑戰(zhàn)在于那些強實驗性的學科,也就是我們常說的“濕實驗”。目前的瓶頸在于數(shù)字智能與物理世界的鴻溝尚未完全填平。雖然AI暫時無法替科學家拿起試管做實驗,但我們正在做的是——讓AI成為實驗設(shè)計的“參謀長”。它可以在實驗前進行海量模擬推演,篩選出成功率最高的方案,從而極大地降低實驗試錯的成本。這是目前AI對實驗學科最大的價值。
商業(yè)與未來:從文字到多模態(tài)
時代周報:學術(shù)智能體是否存在一定的學術(shù)倫理的風險?
羅實:這是一個原則性問題。我們的核心價值觀是 “反學術(shù)不端,做科研增效”。我們嚴守一條紅線——絕不提供“輸入標題直接生成論文”的服務(wù)。
我們將產(chǎn)品嚴格定位在“副駕駛”的位置。我們負責處理“寫作前”的信息搜集和“寫作后”的格式潤色,因為這些環(huán)節(jié)屬于“低創(chuàng)造性勞動”;而論文的核心觀點、創(chuàng)新方法論等“高創(chuàng)造性勞動”,必須且只能由學者本人完成。AI是來輔助駕駛的,方向盤必須始終握在人手里。
時代周報:那怎么考慮數(shù)據(jù)隱私和安全問題?
羅實:這是很重要的一個問題。我們會在技術(shù)層面做加密和隔離,用戶把云端的數(shù)據(jù)放在我們數(shù)據(jù)庫之后,即使物理介質(zhì)被盜走,也無法直接讀取。而且,每個用戶的訪問權(quán)限都有嚴格的機制。我們也不會拿用戶的數(shù)據(jù)去做訓練,這是底線。
時代周報:現(xiàn)在用戶拓展有沒有新進展?
羅實:我們C端的注冊用戶有20多萬,通過這些科研用戶的實戰(zhàn)驗證,目前正在將這套成熟的產(chǎn)品拓展到B端市場,比如和一些大學、醫(yī)院或期刊雜志推進合作。沁言學術(shù)的商業(yè)模式,是訂閱和Token付費相結(jié)合,用戶可以根據(jù)自身需求去購買不同的服務(wù)方案。
時代周報:對于服務(wù)用戶人群的設(shè)想是什么樣的?
羅實:我們的核心用戶是深耕學術(shù)和科研一線的專業(yè)群體,包括高校師生、科研人員、醫(yī)務(wù)工作者以及一些企業(yè)研發(fā)團隊。這些人群很多時候創(chuàng)造的價值比較大,因此對能帶來提效的工具,付費意愿通常比較強。這種類互聯(lián)網(wǎng)產(chǎn)品,核心還是看產(chǎn)品體驗,如果能超出用戶預期,他們還是很認可的。最近,沁言學術(shù)在科教重鎮(zhèn)湖南長沙落地,長沙作為中部的科教重鎮(zhèn),擁有深厚的學術(shù)資源與算力產(chǎn)業(yè)基礎(chǔ)。我們將研發(fā)運營中心落地于此,意在打造‘產(chǎn)學研用’的閉環(huán)示范基地。
時代周報:目前公司能不能做到收支平衡?
羅實:公司目前的現(xiàn)金流健康,整體經(jīng)營狀況實際上已經(jīng)接近收支平衡的臨界點。接下來,我們將重點發(fā)力B端,與高校、醫(yī)院及期刊機構(gòu)深度合作。
時代周報:下一步還有什么產(chǎn)品計劃?
羅實:下一步,我們的核心發(fā)力點是多模態(tài)技術(shù)。學術(shù)科研工作從來不只是文字處理,圖表、公式、數(shù)據(jù)也是信息密度很高的地方。所以,我們要突破純文本的限制,幫用戶解決流程圖繪制、數(shù)據(jù)圖表生成這些最耗時的痛點,成為科研人員真正的“第二大腦”。
時代周報:針對海外市場的計劃是什么?
羅實:海外市場可能會是完全獨立的一個產(chǎn)品。我們考慮把一部分現(xiàn)有功能拆出來,部署到海外市場獨立運營。因為中英文學術(shù)環(huán)境差異巨大,不僅是語言問題,更涉及到引用規(guī)范、版權(quán)體系以及用戶交互習慣的根本不同。我們需要用更本土化的產(chǎn)品邏輯去參與全球競爭。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.