![]()
智東西
作者 程茜
編輯 李水青
智東西2月11日報道,今日,科大訊飛基于全國產算力訓練的星火X2大模型正式發布。
星火X2通用能力實現提升,在其公布的數學、推理、語言理解、智能體等能力測評上可以媲美GPT-5.2、Gemini-3-Pro等模型。星火X1.5于2025年11月6日發布,僅三個月后星火系列新旗艦模型就上線了。
![]()
科大訊飛官方公眾號顯示,星火X2通過量化單臺昇騰服務器即可運行,其采用293B MoE稀疏架構,結合權重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信等多種工程化創新,實現了國產大EP并行部署,推理性能相比X1.5提升50%。
除通用能力升級外,星火X2還在醫療、教育、汽車、智能體等領域針對訊飛的產品實現了升級。
目前,星火X2的最新能力可直接在訊飛星火網頁版和APP體驗,全新API也已上線訊飛開放平臺。
一、能解超難推理題,多項測試可媲美GPT-5.2、Gemini-3-Pro
智東西實測了一波星火X2發現,新模型在回答數學、推理難題時,拆解問題、規劃步驟的思路清晰。
首先,智東西上傳了一道設計概率難題,提示詞為“某工廠生產的產品次品率為5%,隨機抽取200件產品進行檢驗。求恰好有10件次品的概率,若要保證95%的把握認為次品率不超過5%,至少需要抽取多少件產品?”
星火X2先拆解了一共有幾個問題以及要選擇哪一種方式求解,最后給出了恰好有10件次品的概率為12.8%,至少需要抽取59件產品,才能有95%的把握認為次品率不超過5%。
![]()
然后,智東西上傳了一道推理難題,提示詞為“有兩座城:真城人永遠說真話,假城人永遠說假話。一個人來自其中一城,你只能問一個問題,讓他回答是 / 否,就能判斷他來自真城還是假城。你該問什么問題?”
星火X2在回答時分析了問題可以利用的條件,并列出了幾種可能的情況,然后一步步找到最清晰、簡潔的問法。
![]()
在訊飛公布的多項基準測試成績中,星火X2在語言理解、邏輯推理、數學、翻譯、多語言等方面,均超過了DeepSeek V3.2和Qwen3 Max,且與GPT-5.2和Gemini 3 Pro相比得分差距較小。
外部公開高難任務效果對比上,星火X2在數學領域整體表現較好,僅次于GPT-5.2,在綜合知識和復雜問答上,星火X2與GPT-5.2、Gemini-3-Pro、Qwen3-Max差距不大。星火X2的代碼和推理能比,相比GPT-5.2、Gemini-3-Pro有一定差距。
![]()
二、訊飛曉醫解答率均超80%,能同時對比兩張檢查單
面向垂直領域,星火行業大模型在教育、醫療、司法、汽車交互、企業智能體應用等場景的效果也實現了升級。
在醫療領域,星火醫療大模型X2在智能健康分析、智能報告解讀、運動飲食建議、輔助診療、智能用藥審核等關鍵任務上,表現均超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。
![]()
在此基礎上,訊飛曉醫App在多輪主動問診、多輪咨詢問答、問用藥、檢查檢驗單解讀、體檢報告單解讀等健康咨詢任務上的表現升級,解答率均超過80%。
![]()
科大訊飛官方放出了訊飛曉醫解讀檢驗單的案例,其上傳了兩份患兒不同時期的血常規結果,訊飛曉醫會進行聯合解讀,動態分析關鍵指標的變化趨勢,結合患兒年齡對檢驗報告中的不正常數據進行解讀。
不過當智東西更新了訊飛曉醫App后,發現其下方顯示的是“深度思考(X1)”。
三、教育汽車智能體平臺均升級
基于星火X2的汽車智能座艙交互系統、科大訊飛AI學習機、星辰Agent平臺均實現了升級。
在教育領域,星火教育大模型X2數學步驟級批改、錯因定位等能力升級。面向學生自主學習場景,科大訊飛AI學習機在1對1精準學、答疑輔導和互動課等效果持續提升。
![]()
基于星火X2,在汽車領域的2B、7B、30B-A3等多尺寸中小模型同步升級,使得汽車智能座艙交互系統在人人/人機對話判斷、模糊意圖理解、高情商回復等方面交互體驗顯著提升。
![]()
星辰Agent平臺進一步強化了“會思考能執行”的精品智能體構建能力。當前該平臺的智能體數量已經超過130萬,已整合語音交互、語音識別、圖像理解等百余種精品開放平臺能力。
四、4大技術升級,涵蓋算法、數據集、專業思維鏈強化學習
星火X2的升級得益于其背后的四項工程級技術:
訓推采樣校準強化學習算法:針對MoE大模型RL訓練中的訓推分布不一致問題,提出訓練與推理概率重采樣自適應校準算法,提升強化學習訓練準確率和穩定性。
遞歸式高難數據合成方法:針對高難任務數據稀缺問題,設計多輪迭代式推導的數據合成方案,實現推理錯誤逐步糾正與收斂,持續構建稀缺型高質量數據,提升模型深度推理準確率。
多階段RL高吞吐采樣方法:設計P/D(Prefill/Decoder)兩階段分離的多階段推理采樣方案,解決國產化平臺強化學習高吞吐采樣情況下的效率干擾問題,訓練效率提升10%。
服務高性能部署優化算法:通過模型輕量化壓縮,完成國產機器的單機大EP并行部署,推理性能相比星火X1.5提升50%。
結語:行業高專業場景需求凸顯,大模型解決方案逐漸成熟
此次科大訊飛星火X2及其多個行業大模型升級,是面向關鍵行業落地的實用化升級,其面向教育、醫療、汽車、智能體等高專業性、高體驗性場景的升級,或意味著,可以為行業剛需問題提供可行的技術方案。
從長遠和產業發展的宏觀視角來看,如何讓大模型深度嵌入千行百業,切實解決行業痛點、賦能業務流程,才是決定其真正價值與發展潛力的核心命題。科大訊飛此前的技術積累以及與產業客戶的結合,或稱為率先兌現AI紅利的關鍵。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.