- 英矽智能創新的"MMAI Science Gym"訓練框架可顯著提升大語言模型(LLM)在生物化學領域的專精能力
- 經過訓練后,原本在專業任務領域失敗率高達75%–95% 的 LLM,可在關鍵藥物發現基準測試中實現最高 10 倍的性能提升
- 此次發布將進一步推進制藥超級智能(PSI)愿景
上海2026年1月22日/美通社/ -- 由生成式人工智能驅動的生物醫藥科技公司英矽智能(03696.HK)今日發布大語言模型訓練框架Science MMAI Gym,旨在將具有因果推理能力的LLM轉化為具備在真實世界處理藥物發現與開發任務能力的高性能引擎。
![]()
英矽智能深耕AI 領域十余年,已構建覆蓋27 款以上臨床前候選化合物的創新內部管線,其中10 余款分子獲得臨床試驗批件,并已完成或正在推進多項I 期及II 期臨床試驗。以此為基礎,公司于近期搭建并正式上線AI訓練基礎設施Science MMAI Gym,旨在助力包括GPT、Claude、Gemini、Grok、Llama、Mistral等在內的通用LLM進行調整優化,使其能夠以現代制藥研發所需的精度在藥物化學、生物學和臨床開發方面展開推理。
填補制藥領域LLM產出空白
許多知名LLM在通用領域具有強大的推理能力,卻在垂類領域,比如關鍵藥物研發任務中表現差強人意甚至徹底折戟,例如對hERG、藥物性肝損傷(DILI)風險等復雜藥代動力學與毒理終點的預測。根據英矽智能匯總的基準評測結果顯示,即使經過提示詞優化,通用模型在專精領域輸出的結果往往是模糊的,或提出不合生化領域邏輯的推理。
Science MMAI Gym 有望填補這一空白,通過向LLM 系統化傳授垂直領域的科學推理能力,使其理解化學家、生物學家與臨床醫生在實踐中使用的語言、表達格式與概念鏈條,而非僅將藥物發現簡化為一般的NLP(自然語言處理)基準測試。
Science MMAI Gym主要聚焦以下領域:
- 藥物和有機化學:多步優化鏈、反應推理、逆合成模板、構效關系和三維結合相互作用。
- 生物學和靶點發現:基因表達、通路、疾病機制和多目標靶點評分的組學感知推理。
- 臨床開發:試驗設計、終點、反應生物標志物的解釋,以及使用專有基準(如ClinBench)預測II期試驗的成功或失敗。
訓練整體架構:化學超級智能和生物學超級智能
Science MMAI Gym 是英矽智能邁向"制藥超級智能"(Pharmaceutical Superintelligence,PSI)長期路線圖的核心組成,設置兩條垂直訓練方向:化學超級智能(Chemical Superintelligence,CSI)與生物學超級智能(Biology Superintelligence,BSI)。
在 Science MMAI Gym 中,AI 模型將經歷持續數周至數月的迭代訓練,主要基于:
- 高質量、領域特定的推理數據集: 依托數百萬級內部數據點,包括 400 萬+ 藥物化學優化鏈、1 億條有機合成描述,以及數十萬條分子動力學軌跡。
- 多任務微調與強化學習:通過多任務監督微調(SFT)與強化微調(RFT),結合獎勵模型打磨推理能力,并將模型預測與實驗結果對齊。
- 穩健的基準評測:每個訓練周期都會在公開及內部的分布外(OOD)基準上進行驗證,包括 TDC、TargetBench 與 ClinBench,確保模型在真實應用場景中具備穩定、可靠的表現。
從通用到專精:早期案例研究和成果
內部基準測試顯示,MMAI Science Gym 可顯著提升模型在藥物研發關鍵任務中的表現:
- 化學超級智能(CSI):一款此前在70%藥化任務中失效的開源LLM,經Gym訓練后升級為"單模型一站式"的化學引擎。在多項 ADMET 任務上達到業界領先或接近領先的水平,并在 MuMO-Instruct 基準的五項優化任務中取得業界領先的成功率,表現可匹配甚至超越強勢的類別專用通用模型。
- 生物超級智能(BSI):經過Gym訓練的模型在專有基準上進步顯著。在 TargetBench 上,BSI調優模型在多種疾病的新靶點識別中獲得最高綜合排名,體現出更高的生物學合理性與轉化潛力。
商業模式:用于科學研究的會員制"AI GYM"
Science MMAI Gym 以靈活的會員制項目形式提供,既可支持為期兩周或一個月的密集沖刺,也可支持為期三個月及以上、面向PSI 的長期合作。合作伙伴提交其基礎模型后,可獲得經CSI/BSI/PSI 增強的版本,相較基準模型性能最高提升10 倍;同時將獲得詳盡的基準測試報告,并可選配通過英矽智能自動化檢測平臺開展濕實驗驗證。
關于英矽智能
英矽智能是一家全球先鋒生物科技公司,致力于整合人工智能和自動化技術,加速藥物發現并推動生命科學領域的創新,賦能人類更長久更健康的生活。2025年12月30日,公司于香港聯交所主板掛牌上市,股票代碼:03696.HK。
利用自主研發的Pharma.AI 平臺和先進的自動化生物學實驗室,英矽智能正在為纖維化、腫瘤學、免疫學、疼痛、肥胖和代謝紊亂等未滿足的疾病領域提供創新藥物解決方案。此外,英矽智能持續將Pharma.AI應用拓展到多元化領域,如先進材料、農業、營養產品及獸醫藥物。更多信息,請訪問網站www.insilico.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.