極目新聞通訊員 王晉昊 楊柯 汪如意
![]()
“最初拿到中國航天研究院的項目需求時,我們完全摸不著頭腦!”近日,2025年度中國青年科技創新“揭榜掛帥”擂臺賽傳來捷報,湖北工業大學本科生團隊“面向綜合集成研討的戰略博弈智能體構建技術”項目,在新一代信息技術領域脫穎而出,榮獲全國特等獎。這支以大三學生為核心的團隊,歷時5個月攻堅,在不完全信息博弈建模、智能算法優化等方面實現突破,成功攻克航天領域技術難題。
五個月攻堅,從“看不懂”到“啃下來”
項目源自中國航天研究院的戰略博弈技術需求,初期僅明確研發智能算法,核心規則與操作平臺遲遲未公布,讓以大數據管理與應用專業學生為主的團隊陷入困惑。直到7月初,研究院發布基于卡牌游戲的仿真平臺,包含9類國家身份、4個階段隨機事件,對戰雙方需在未知對方身份與決策邏輯的情況下投入資源博弈,本質是典型的不完全信息博弈問題。
“游戲化平臺讓寬泛的技術需求有了明確方向。”團隊負責人田俊杰介紹,項目自6月啟動以來,全國19支高校隊伍參與角逐,11支隊伍晉級決賽。初賽需擊敗官方基礎智能體,決賽采用“兩兩PK”循環對戰模式,每兩隊完成1000場對戰。
備賽路上挑戰重重。最初,在指導老師胡昌龍的建議下,團隊計劃采用大語言模型技術,卻在7月中旬接到“算法需本地部署、禁止聯網”的規則限制,依賴聯網數據的大模型效果大幅下滑,前期研究近乎白費。面對困境,團隊拆分6個研究方向分組攻關,有的小組嘗試數學建模羅列所有場景,有的借鑒已發表論文的算法框架,還有的聚焦算法輕量化優化。為了篩選最優方案,團隊內部PK,通過數萬場模擬對戰記錄數據,保留效果最佳的算法并持續迭代。
平臺Bug的出現更讓團隊遭遇重創。7月中旬,研究院修復身份顏色對應錯誤問題,而團隊此前基于錯誤映射訓練的模型與提示詞全部失效,半個月的心血付諸東流。“我們連夜調整代碼,重新建立身份與策略的對應關系,同時優化算法結構,確保在不聯網環境下也能保持決策精度。”田俊杰說,為了兼顧決策速度與收益,他們舍棄了復雜的深度學習框架,采用輕量化算法設計,最終實現0.02秒快速響應,既滿足比賽時間限制,又保證了對戰勝率。
![]()
團隊備賽
團隊的高效協作是攻堅關鍵。團隊建立了“一日一調度、兩日一會議”的工作機制,每周指導老師還會進行一對一輔導。成員們分工明確,部分成員負責代碼編寫與算法調優,其他成員承擔文獻查閱、數據記錄、平臺測試等工作,甚至主動聯系航天研究院技術人員溝通規則細節,確保研發不偏離方向。
技術落地可期,拓展多場景應用價值
經過數月打磨,團隊研發的智能算法在決賽中表現亮眼,不僅在千場對戰中保持高勝率,其快速決策能力與穩定性能也獲得評委認可。該算法通過精準分析已知對戰信息,動態調整資源投入策略,在不完全信息環境下實現收益最大化,其核心邏輯不僅適用于航天領域的戰略博弈場景,還可拓展至應急資源調度、金融投資決策、智慧城市管理等多個領域。
“應急調度本質上也是一種不完全信息下的決策問題,比如災害發生后,如何在信息不充分的情況下優化資源分配,我們的算法思路可以提供解決方案。”胡昌龍表示,目前已有多個相關項目表達了技術借鑒意向,團隊未來計劃進一步深化研究,推動技術在實際場景中落地。
“從最初的興趣驅動,到后來的責任擔當,這段經歷讓我們明白科技創新既要敢想敢試,更要腳踏實地。”團隊成員羅友真說,作為本科生,他們在備賽過程中不僅提升了代碼編寫、算法設計等專業能力,更學會了在挫折中調整方向、在協作中凝聚力量。
“最珍貴的不是比賽結果,而是學生在參賽過程中的轉變。”經濟與管理學院黨委副書記余貞說。此次獲獎不僅是對團隊努力的認可,更堅定了他們深耕信息技術領域、用科技解決實際問題的決心。
“學科的邊界正在模糊,創新的前沿往往生于交叉地帶。”胡昌龍表示,這個項目或許只是一個起點,但它清晰地揭示了一種可能:當管理思維與前沿數字技術深度融合時,傳統的“軟學科”便能鍛造出解決時代“硬問題”的真本領。
(來源:極目新聞)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.