編輯部 整理自 MEET2026量子位 | 公眾號 QbitAI
對企業來說,如何判斷大模型究竟是真的有用,還是只是噱頭?
對此,潞晨科技創始人兼董事長,新加坡國立大學校長青年教授尤洋給出了他的判斷框架:
- 有三類企業需要行業模型或者私有模型:傳統大型企業、有海量數據的中小型企業,以及顛覆行業的新興公司。
![]()
具體落地方面,尤洋給出的判斷標準也很明確。
首先,如果只是業務只涉及日常辦公,或主要處理文本數據,沒必要上私有模型
直接調用現成的大模型API,或RAG+API,足以覆蓋大多數需求。
如果企業本身擁有海量多模態數據,或對數據隱私有要求,構建私有模型是比較好的選擇
為了完整呈現尤洋的思考,在不改變原意的基礎上,量子位對演講內容進行了整理編輯,希望能提供新的視角與洞察。
MEET2026智能未來大會是由量子位主辦的行業峰會,近30位產業代表與會討論。線下參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。
核心觀點梳理
- 大模型的應用肯定不僅限于聊天機器人或者編程助手,未來大模型在千行百業里邊落地,才能產生它最大的價值。大模型的價值在很多場景還沒有真正發揮出來。
- 有三類企業需要行業模型或者私有模型,第一類是傳統大型企業,第二類是有海量數據的中小型企業,第三類是顛覆行業的新興公司。
- 用大模型做To B,最關鍵的是后訓練或Agent化,如果只是調大模型API,大家用的模型都一樣,顯然沒有任何差異性。開源模型只有在被“專業訓練”后才能戰勝閉源模型。
- 企業部署大模型成功的關鍵,一是要最大化算力效率,另外還要有微調SDK和低代碼模板。
- 潞晨云最新上線微調SDK,開發者僅需專注模型與算法創新,訓練調度、分布式框架適配、底層云基礎設施及運維由平臺完成。
以下是尤洋的演講全文:
四年收獲八個世界五百強,十個世界兩千強
今天很開心在量子位大會跟大家交流,潞晨堅信未來AI大模型在千行百業里面落地,才能產生它最大的價值,而不僅僅限于聊天機器人或者編程助手。
我是新加坡國立大學的教授,很榮幸在2021年ChatGPT為代表的大模型浪潮前,就創立了潞晨科技這家公司,專注于該領域。
首先介紹一下潞晨在過去幾年的一些實踐,取得的一些成績。
![]()
技術方面,2018年開始,潞晨開始著手做一些大模型的基礎設施相關的軟件,最下層的不管從編譯器還是CUDA包括優化器,都是訓練部署大模型比較需要的。
比如2018年打造的LAMB優化器,在Google的千卡集群TPU Pod上將大模型訓練時間從三天縮減到76分鐘
今天,LAMB優化器和方法還在被微軟的DeepSpeed、字節的Megascale,以及英偉達的Megatron-LM等萬卡集群系統所使用。
基于LAMB,潞晨做了一些后續工作,成功應用在華為的盤古大模型以及字節的推薦模型里,并獲得了ACL杰出論文。
世界上最頂尖的專家之一,Benjamin Mann(Anthropic的聯合創始人,GPT-3的共同第一作者),他在2019年使用LAMB,首次把Transformer訓練擴展到128個GPU。
![]()
這從英偉達官方GitHub上可以查到,英偉達專家曾經使用過LAMB取得17倍的加速
![]()
之后,潞晨把這些針對大模型訓推性能的系統優化技術,打造成了一個軟件系統Colossal-AI,并對基礎版本進行了開源。
潞晨希望通過更好用、速度更快、性價比更高的系統或者軟件,幫助用戶降本增效的做出所需要的私有模型。
經過幾年發展,Colossal-AI在GitHub上這個細分賽道里面指標是最高的,大家可以嘗試一下開源版本,潞晨也提供相應的進階商業支持。
![]()
目前,潞晨收獲了八個世界五百強,十個世界兩千強,六十個一流大學和三千家企業在內來自全球的付費客戶,涵蓋了汽車、互聯網、手機、制藥、制造業等等。
這個過程之中,大家對大模型的認可程度是逐漸變高的。
對標Thinking Machines Lab,挖掘AI落地千行百業的價值
OpenAI前CTO也做了一個創業公司叫Thinking Machines Lab,雖然沒有任何收入但是估值已經120億美金了。
它跟潞晨做的事情也比較類似,打造了Tinker模型微調開發平臺,幫助企業和研發人員做出自己的私有模型或者AI Agent。
還有Together AI,通過優化技術提升GPU的價值。
任何企業做大模型,大多數決策者首先要問的第一個問題就是:我的企業是否真的需要大模型,大模型是不是真的有效,還是只是一個噱頭?
先展示一些互聯網上可以查到的案例:中石油的三千億參數的昆侖大模型,Bloomberg的金融大模型,華為云發布的盤古氣象大模型,寶馬的優化汽車制造流程的大模型以及李維斯、航空航天、動畫、西門子,還有制藥行業。
![]()
從這大概可以看出這些行業的數據特點,不僅僅是DeepSeek或者ChatGPT這樣的通用文本或者編程模型能解決的,更重要的是大模型在千行百業落地價值,很多場景還沒有真正發揮出來
比如說未來的石油勘探,讓大模型判斷地下的地質結構,研究地球的數據。比如打一口井成本是1000萬美金,打十次才有一口比較好的油井,通過大模型優化即使只提升10%,在這個行業的收益前景也非常可觀。
之前大家用一些正演反演算法判斷地下的斷層、地下復雜的結構數據量非常大,PB級別的,傳統的算法穩定性不好,速度也比較慢無法擴展。
大模型可以用更好的方式,核心都是在解方程組,可以給出一個很好的近似解。因此,大模型在千行百業的價值還沒有完全發揮出來。
下一個問題是:到底什么樣的企業或者什么樣的業務需要自己做一個私有大模型,不僅僅調用一下標準模型的API就夠了?
至少有三類:
第一類,傳統的大型企業,包括世界五百強全球兩千強,這些企業或多或少都有自己行業比較珍貴的大量信息或者數據。
第二類,有海量數據的中小型企業,可能專精于某個細分領域,數據就是大模型的源泉。
第三類,顛覆行業的新型公司用AI技術找到新的思路,不管金融、制藥、社交、游戲、電商等等都可以。這些企業是最需要自己造一個私有大模型或者行業大模型的企業。
具體落地方式有三種。
第一,假如說沒有行業數據,只是處理一些日常辦公或者處理文本類的東西,企業直接調用ChatGPT或者通義千問API一般就能滿足需求。
第二,假如說有足量的文本數據,這個階段很多時候不用構建自己的大模型,構建RAG/Agent加上大模型API也能滿足。
第三,如果一個企業有海量多模態數據或者強隱私要求,不管是石油勘探或者高鐵、汽車、制藥、金融等,往往有很多多模態數據,這時候構建一個私有模型是比較好的選擇來滿足需求
這張圖來自于一個Grand View Research,它對大語言模型市場的預測,大概分為三個部分。
![]()
第一,Domain-Specific LLMs,就是領域大模型,做法律GPT、醫療GPT、教育GPT、或者說石油化工GPT這種都是領域大模型。
第二,通用大模型
第三,私有大模型,這個大模型只能放在公司內部用,與外部隔離。
當然這個預測不一定準確,但潞晨可以觀察一下它預測的未來趨勢:
- 領域大模型未來到2033年的時候是最大的,大概占40%的市場份額;
- 通用大模型ChatGPT或者豆包或者Gemini占30%;
- 私有大模型也能占到30%。
Training As A Service
下一個問題,如果決定打造自己的私有大模型或者行業大模型,如何用好大模型?
在大模型ToB賽道,首先先不用考慮去做通用的ChatGPT或DeepSeek,因為不在同一個賽道。
如果用大模型做ToB的話,最關鍵的就是后訓練或者Agent化。如果只是調通用大模型API的話,大家用的大模型都一模一樣,顯然沒有任何差異性和競爭壁壘
開源基模或者標準API,經過專業的后處理,才能戰勝閉源模型。即給它足量的行業數據,最好是多模態數據,在高效優化情況下把大模型優化成行業專才。
這要求企業把兩方面事情做好:
第一,最大化算力的效率,只要我在造私有大模型,肯定算力一個很大的賬單。
第二,做出很好的微調模板,讓用戶快速做出自己行業模型、私有模型。
剛才提到目前業界龍頭是Thinking Machines Lab的Tinker,潞晨打造了一個類似的產品,潞晨云的微調SDK
潞晨希望打造成標準化模板式的服務,讓用戶只需用微調SDK就可以達到Training As A Service的效果。
不管是強化學習還是微調本質上都是Training,都是在算梯度,算出更好的梯度,梯度不斷的更新參數。
開發人員、研究人員不管是石油公司的大模型開發人員還是金融公司、制藥公司的,他們應該專注于自己的數據和業務,而不應該花太多時間構建自己的GPU集群、分布式計算、優化器等大模型基礎設施的東西。
目前這類產品有兩個極端:
第一,極端強調零代碼微調,壞處用戶對模型的控制力度大幅度下降,只能搭建demo級別的玩具,很難在真實業務落地。
第二,極端全手寫裸機開發,全棧工程師自己搞定操作系統、分布式計算、優化器、張量并行、數據并行、集群運維等,顯然浪費太多精力。
潞晨希望把復雜的流程變成函數級的管理。用戶的目的本質上就是算梯度,由這幾個函數負責把后臺這些東西管理好,這樣用戶只需要調用這幾個函數級的指令就可以快速的造出自己的行業模型、私有模型。
![]()
想讓用戶快速、簡便、低成本地造出自己的行業模型、私有模型,關鍵在于實現工程與靈活度的最優平衡,既不是零代碼的微調也不是全手寫的裸機。
這是整個流程,通過這種方式按照SDK定義一下模型和數據一鍵式在云上訓練部署,這樣也能兼容Tinker的各種開源的SDK,實現監督微調、強化學習等。背后也集成了潞晨對算力性能優化的工具Colossal-AI來幫助用戶降低成本。
![]()
當然,用戶也可以選擇自己的框架、編程工具、任務調度方式等。
最后是一些真實案例:
- 某個世界五百強車企通過這套技術打造出多模態自動化的決策支持系統;
- 世界五百強電商的自動駕駛業務,在3D點云技術也在潞晨的幫助下得到很大的提升;
- 潞晨也助力另一家世界五百強車企打造智能座艙模型;
- 潞晨還幫助一家制造業世界500強企業打造了基于AI Agent及具身智能的供應鏈系統。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.