美國(guó)軍方正積極推進(jìn)大語(yǔ)言模型(Large Language Model,LLM)的軍事化應(yīng)用,核心戰(zhàn)略目標(biāo)是獲取“決策優(yōu)勢(shì)”。在現(xiàn)代沖突中,美軍期望比對(duì)手更快、更準(zhǔn)確地處理海量信息、生成預(yù)測(cè)模型并輔助決策。這種對(duì)“機(jī)器速度”決策的追求,預(yù)示著未來(lái)作戰(zhàn)將從以人為中心向人工智能輔助甚至人工智能驅(qū)動(dòng)的節(jié)奏轉(zhuǎn)變,其中速度成為關(guān)鍵因素。美國(guó)國(guó)防部(Department of Defense,DoD)將人工智能(Artificial Intelligence,AI)視為在數(shù)字化競(jìng)爭(zhēng)世界中保持軍事優(yōu)勢(shì)的關(guān)鍵要素,尤其在應(yīng)對(duì)大力投資人工智能的對(duì)手時(shí)。國(guó)防部的人工智能戰(zhàn)略強(qiáng)調(diào)以合法、負(fù)責(zé)任和可問(wèn)責(zé)的方式利用人工智能,使其符合國(guó)家價(jià)值觀和戰(zhàn)爭(zhēng)法。
![]()
1.ScaleAI:軍事大語(yǔ)言模型發(fā)展的基石伙伴
Scale AI自2016年成立以來(lái),一直致力于構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的人工智能基礎(chǔ)設(shè)施,并迅速將技術(shù)優(yōu)勢(shì)擴(kuò)展到美國(guó)國(guó)防與情報(bào)領(lǐng)域。該公司與美國(guó)國(guó)防數(shù)字和人工智能辦公室(Chief Digital and Artificial Intelligence Office,CDAO)簽署了其他交易協(xié)議(Other Transaction Agreement,OTA),為聯(lián)合部隊(duì)提供數(shù)據(jù)策劃和標(biāo)注服務(wù),助力AI原型從實(shí)驗(yàn)室邁向前線部署。在安全與可控性方面,Scale AI組建了“安全、評(píng)估與對(duì)齊實(shí)驗(yàn)室”(SEAL),匯聚紅隊(duì)攻防和強(qiáng)化學(xué)習(xí)人類(lèi)反饋(Reinforcement Learning from Human Feedback,RLHF)專(zhuān)家,對(duì)大型語(yǔ)言模型進(jìn)行系統(tǒng)級(jí)測(cè)試和威脅評(píng)估,確保模型在極端環(huán)境下的穩(wěn)定性和可控性。
![]()
圖 Donovan運(yùn)作機(jī)制
在此背景下,多諾萬(wàn)平臺(tái)(Donovan)應(yīng)運(yùn)而生,成為Scale AI面向政府與軍工客戶推出的端到端AI代理管理與部署解決方案。Donovan具備大規(guī)模文檔攝取和實(shí)時(shí)情報(bào)分析能力,可在數(shù)分鐘內(nèi)處理超過(guò)10萬(wàn)頁(yè)的命令、態(tài)勢(shì)報(bào)告和開(kāi)源數(shù)據(jù),并通過(guò)RLHF流水線持續(xù)微調(diào)模型以滿足作戰(zhàn)需求。平臺(tái)內(nèi)置紅隊(duì)工具和定制化評(píng)估基準(zhǔn),確保所部署的代理在復(fù)雜戰(zhàn)術(shù)場(chǎng)景中既能提供準(zhǔn)確見(jiàn)解,又能遵循國(guó)際人道法和國(guó)家情報(bào)總監(jiān)辦公室(Office of the Director of National Intelligence,ODNI)的寫(xiě)作規(guī)范。Donovan已成為首批能夠在分類(lèi)網(wǎng)絡(luò)上運(yùn)行的大型語(yǔ)言模型基礎(chǔ)設(shè)施之一,支持聯(lián)合作戰(zhàn)計(jì)劃、后勤保障和兵棋推演等關(guān)鍵用例,大幅縮短了“從數(shù)據(jù)到行動(dòng)”的反饋周期。
![]()
圖 Donovan運(yùn)作邏輯
在Donovan生態(tài)內(nèi),Defense Llama大語(yǔ)言模型代表了Scale AI與Meta(前Facebook)開(kāi)源Llama 3模型合作的最新成果。該模型通過(guò)Scale的Data Engine進(jìn)行精細(xì)微調(diào),訓(xùn)練數(shù)據(jù)囊括軍事條令、國(guó)際人道法和國(guó)防部AI倫理原則,使其能夠在戰(zhàn)術(shù)規(guī)劃、目標(biāo)分析和態(tài)勢(shì)感知等場(chǎng)景中給出符合專(zhuān)業(yè)規(guī)范的響應(yīng)。Defense Llama僅限于在政府專(zhuān)用的、安全受控的系統(tǒng)內(nèi)部署,且始終保持“人類(lèi)監(jiān)督”機(jī)制,并可與Donovan平臺(tái)無(wú)縫銜接,能夠作為智能代理為指揮官提供多域作戰(zhàn)建議和替代行動(dòng)方案評(píng)估。
![]()
圖 Donovan演示界面
2.“雷神之錘”項(xiàng)目:整合人工智能以支持作戰(zhàn)規(guī)劃
“雷神之錘”(Thunderforge)是美國(guó)國(guó)防創(chuàng)新小組(Defense Innovation Unit,DIU)的一項(xiàng)旗艦計(jì)劃,其目的是將人工智能深度整合到軍事作戰(zhàn)和戰(zhàn)區(qū)級(jí)規(guī)劃中,并與先進(jìn)的建模和仿真工具相結(jié)合。該系統(tǒng)的目標(biāo)是加速?zèng)Q策,使規(guī)劃人員能夠快速綜合海量信息,生成多種行動(dòng)方案,并進(jìn)行人工智能驅(qū)動(dòng)的兵棋推演,以預(yù)測(cè)和應(yīng)對(duì)不斷演變的威脅。DIU領(lǐng)導(dǎo)層指出,當(dāng)前的規(guī)劃方法已過(guò)時(shí),無(wú)法適應(yīng)現(xiàn)代戰(zhàn)爭(zhēng)的激烈敏捷性和現(xiàn)代化設(shè)備。“雷神之錘”標(biāo)志著向人工智能驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)戰(zhàn)爭(zhēng)的決定性轉(zhuǎn)變。
“雷神之錘”技術(shù)解決方案將提供人工智能輔助的規(guī)劃能力、決策支持工具和自動(dòng)化工作流程。它利用先進(jìn)的大型語(yǔ)言模型、人工智能驅(qū)動(dòng)的模擬和交互式基于代理的兵棋推演,以增強(qiáng)美國(guó)軍方準(zhǔn)備和執(zhí)行作戰(zhàn)的能力。該系統(tǒng)最初將部署到美國(guó)印太司令部(United States Indo-Pacific Command,INDOPACOM)和美國(guó)歐洲司令部(United States European Command,EUCOM),以支持關(guān)鍵的規(guī)劃活動(dòng),包括戰(zhàn)役發(fā)展、全戰(zhàn)區(qū)資源分配和戰(zhàn)略評(píng)估。其跨多個(gè)安全領(lǐng)域的整合確保了人工智能驅(qū)動(dòng)的規(guī)劃能力將安全地嵌入到實(shí)際軍事行動(dòng)中。
“雷神之錘”是一項(xiàng)多方合作的努力,涉及Scale AI(提供代理應(yīng)用、生成式人工智能測(cè)試和評(píng)估專(zhuān)業(yè)知識(shí))、Anduril(提供Lattice建模/仿真軟件平臺(tái))和微軟(提供最先進(jìn)的大型語(yǔ)言模型技術(shù))。該團(tuán)隊(duì)的目標(biāo)是提供一個(gè)統(tǒng)一的規(guī)劃生態(tài)系統(tǒng),其中人工智能代理可以模擬兵棋推演和規(guī)劃場(chǎng)景,并完善提議的行動(dòng)方案。
![]()
圖 lattice系統(tǒng)界面
微軟作為“雷神之錘”項(xiàng)目的重要技術(shù)伙伴,其提供的大型語(yǔ)言模型技術(shù)是構(gòu)建這一先進(jìn)規(guī)劃生態(tài)系統(tǒng)的核心組成部分。此外,其他公司如Systematic也在國(guó)防人工智能項(xiàng)目中探索利用大語(yǔ)言模型,執(zhí)行文檔摘要、翻譯和軍事文檔解釋等任務(wù),并研究“大語(yǔ)言模型作為評(píng)判者”(LLM-as-a-judge)的技術(shù),以自動(dòng)化評(píng)估模型表現(xiàn),確保為國(guó)防客戶提供高質(zhì)量的AI產(chǎn)品。
3.戰(zhàn)場(chǎng)環(huán)境下軍事大語(yǔ)言模型的可靠性與安全風(fēng)險(xiǎn)考量
軍事大語(yǔ)言模型在決策支持和情報(bào)分析中雖展現(xiàn)出明顯優(yōu)勢(shì),但其內(nèi)在缺陷和潛在威脅在實(shí)戰(zhàn)環(huán)境中尤為突出。模型的“幻覺(jué)”問(wèn)題會(huì)導(dǎo)致其在關(guān)鍵戰(zhàn)術(shù)或后勤規(guī)劃中產(chǎn)生不準(zhǔn)確甚至完全錯(cuò)誤的輸出,若憑此做出作戰(zhàn)或資源分配決策,將嚴(yán)重影響部隊(duì)效能和安全。提示注入攻擊能夠繞過(guò)現(xiàn)有的安全檢查,誘使模型暴露機(jī)密信息或執(zhí)行惡意指令,一旦發(fā)生機(jī)密泄露或錯(cuò)誤指令下發(fā),將對(duì)軍事行動(dòng)造成直接威脅。此外,用于模型微調(diào)的敏感軍用數(shù)據(jù)若管理不當(dāng),既可能侵犯第三方知識(shí)產(chǎn)權(quán),也會(huì)在訓(xùn)練管道中留下安全漏洞,為對(duì)手提供反向工程和情報(bào)竊取的機(jī)會(huì)。
更為嚴(yán)重的是,大語(yǔ)言模型的決策過(guò)程高度依賴(lài)“黑箱”算法,缺乏透明度和可解釋性。一旦在行動(dòng)中出現(xiàn)誤判或失誤,難以迅速追蹤問(wèn)題根源,也難以界定是算法偏差、數(shù)據(jù)質(zhì)量不佳還是人類(lèi)監(jiān)督不到位所致,從而使責(zé)任歸屬和問(wèn)責(zé)機(jī)制形同虛設(shè)。Meta雖對(duì)外宣稱(chēng)禁止將Llama用于軍事活動(dòng),卻在內(nèi)部為國(guó)防承包商和情報(bào)機(jī)構(gòu)開(kāi)辟例外,使得合規(guī)政策形同擺設(shè),也為其他國(guó)家或非國(guó)家行為體復(fù)制使用模式提供了便利,進(jìn)一步增加了技術(shù)擴(kuò)散和濫用的風(fēng)險(xiǎn)。綜上所述,除非在嚴(yán)格的安全加固、持續(xù)的人機(jī)協(xié)同監(jiān)督以及透明的審計(jì)與問(wèn)責(zé)框架下,否則將大語(yǔ)言模型直接投入戰(zhàn)時(shí)決策支持,難以在高度敏感的國(guó)防場(chǎng)景中保證可靠性與合規(guī)性。
4.結(jié)論與未來(lái)方向
美軍正加速推進(jìn)大語(yǔ)言模型(LLM)的軍事化應(yīng)用,核心目標(biāo)是奪取“決策優(yōu)勢(shì)”。LLM憑借其“機(jī)器速度”的信息分析能力,大幅縮短“從數(shù)據(jù)到行動(dòng)”的反饋周期,使指揮官能迅速掌握戰(zhàn)場(chǎng)態(tài)勢(shì)并生成精準(zhǔn)預(yù)測(cè),從而搶占先機(jī)。大語(yǔ)言模型還能與建模仿真技術(shù)的深度融合,為作戰(zhàn)規(guī)劃與兵棋推演提供強(qiáng)大支持,實(shí)現(xiàn)高效地方案生成與威脅模擬,從而指揮官提供關(guān)鍵參考,顯著提升決策制定的效率與速度。
在短期研究與應(yīng)用中,為應(yīng)對(duì)當(dāng)前軍事AI的固有挑戰(zhàn),美軍將著重提升LLM在魯棒性、安全性與可控性方面的表現(xiàn)。其中包括構(gòu)建嚴(yán)密的測(cè)試驗(yàn)證體系、強(qiáng)化數(shù)據(jù)治理與網(wǎng)絡(luò)防護(hù),以及貫徹“有意義的人類(lèi)主控(Meaningful Human Control, MHC)”原則。這些舉措將確保LLM能無(wú)縫嵌入現(xiàn)有指揮控制系統(tǒng),并在關(guān)鍵時(shí)刻由人工暫停或糾偏,從而有效抵御“幻覺(jué)”誤導(dǎo)、提示注入攻擊和敏感信息泄露,進(jìn)而構(gòu)建高效的人機(jī)協(xié)同操作流程。
從更長(zhǎng)遠(yuǎn)的視角看,LLM將深度融入陸、海、空及盟軍聯(lián)合作戰(zhàn)的全流程。在未來(lái)戰(zhàn)爭(zhēng)中,LLM不僅具備強(qiáng)大的信息分析與規(guī)劃輔助能力,還有望通過(guò)自主學(xué)習(xí)和推理,實(shí)現(xiàn)復(fù)雜環(huán)境下的自適應(yīng)決策與資源優(yōu)化,動(dòng)態(tài)調(diào)整戰(zhàn)術(shù)部署與優(yōu)化后勤鏈路,甚至在網(wǎng)絡(luò)空間中執(zhí)行高階威脅識(shí)別與響應(yīng)。這種深度融合將為指揮官提供前所未有的戰(zhàn)場(chǎng)全局洞察與未來(lái)行動(dòng)預(yù)判能力。然而,這種能力擴(kuò)展亦伴隨深層次挑戰(zhàn),即LLM如何在電磁對(duì)抗和網(wǎng)絡(luò)攻防等嚴(yán)苛環(huán)境中持續(xù)保持其可靠可控性,以及實(shí)現(xiàn)全生命周期的高度透明與責(zé)任可溯。(來(lái)源:北京藍(lán)德信息科技有限公司)
參考文獻(xiàn)
Leadership: Artificial Intelligence in Decision-Making | Article | The United States Army, https://www.army.mil/article/286847/leadership_artificial_intelligence_in_decision_making Innovating Defense: Generative AI's Role in Military Evolution ..., https://www.army.mil/article/286707/innovating_defense_generative_ais_role_in_military_evolution The Pentagon is upping its bet on AI. Here's what it means for the military - QZ.com, https://qz.com/pentagon-scale-ai-us-military-china-1851767958
Research Shows Risk in Using LLMs for Military Decision-Making - Techstrong.ai, https://techstrong.ai/articles/research-shows-risk-in-using-llms-for-military-decision-making/us department of defense responsible artificial intelligence strategy ..., https://www.ai.mil/Portals/137/Documents/Resources%20Page/DoD%20Responsible%20AI%20Strategy%20and%20Implementation%20Pathway.pdf
How to Scale AI in Your Business - Oracle, https://www.oracle.com/artificial-intelligence/scale-ai-in-business/
Scale AI: Accelerate the Development of AI Applications, https://scale.com/
Scale AI - Wikipedia, https://en.wikipedia.org/wiki/Scale_AI
Donovan: Empowering the Public Sector with AI Agents | Scale AI, https://scale.com/donovan Scale AI launches Defense Llama - Intelligence Community News, https://intelligencecommunitynews.com/scale-ai-launches-defense-llama/Ethical Principles for Artificial Intelligence, https://www.edinstudy.law.ed.ac.uk/wpcontent/uploads/sites/38/2021/11/US-Ethical-Principles-for-Artificial-Intelligence.pdf
Large Language Models for System Security Engineering Analysis - Army SBIR, https://armysbir.army.mil/topics/large-language-models-system-security-engineering-analysis/Thunderforge Project: Integrating Commercial AI-Powered Decision ..., https://www.diu.mil/latest/dius-thunderforge-project-to-integrate-commercial-ai-powered-decision-making Scale AI awarded Defense Innovation Unit (DIU) Thunderforge contract - OrangeSlices AI, https://orangeslices.ai/introducing-thunderforge-ai-for-american-defense/Transcending weapon systems: the ethical challenges of AI in military decision support systems - Blogs | International Committee of the Red Cross, https://blogs.icrc.org/law-and-policy/2024/09/24/transcending-weapon-systems-the-ethical-challenges-of-ai-in-military-decision-support-systems/Meet Thunderforge—DOD's Latest AI Play - GovCon Wire, https://www.govconwire.com/article/thunderforge-dod-scale-ai-prime-prototype-contract On Large Language Models in National Security Applications (2407.03453v1) - Emergent Mind, https://www.emergentmind.com/articles/2407.03453 CDAO Sponsors Crowdsourced AI Assurance Pilot in the Context of Military Medicine, https://www.defense.gov/News/Releases/Release/Article/4020407/cdao-sponsors-crowdsourced-ai-assurance-pilot-in-the-context-of-military-medici/Rules of Engagement as a Regulatory Framework for Military Artificial Intelligence, https://lieber.westpoint.edu/rules-engagement-regulatory-framework-military-artificial-intelligence/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.