2023年以來,以大語言模型為代表的生成式人工智能技術取得突破性進展,新産品、新技術陸續亮相,引發新一輪人工智能發展熱潮。隨着生成式人工智能系統在商用領域的成功應用,美軍意識到生成式人工智能在指揮控制、情報分析、作戰規劃、輔助決策等軍事領域具有巨大的應用潛力,因此已經開始推進生成式人工智能技術的軍事化應用。
生成式人工智能在指揮控制領域的作用意義
生成式人工智能可以為用戶提供涵蓋廣泛領域的問題解答,幫助用戶撰寫文章、郵件等各種文本內容,根據用戶輸入為長篇文章生成簡潔摘要、幫助用戶快速了解關鍵信息,進行多語言間的機器翻譯,多種編程語言按需自動生成代碼,實時在線為客戶服務等。美國防部認為,大型語言模型等生成式人工智能技術在情報分析、戰場環境支持、通信和網絡安全、態勢感知和數據融合、軍事數據管理、軍事建模與作戰模擬倣真等軍事領域均有巨大應用潛力,因此美軍迫切需要提高生成式人工智能模型的速度和交互能力等優勢來提高任務效率。根據生成式人工智能系統的主要能力,將其應用到作戰指揮中主要具有以下幾方面意義:
一是可使作戰數據保障更加精準。根據具體作戰任務,通過生成式人工智能系統式服務準確理解指揮員意圖,在海量的各類作戰信息數據中快速精準查詢,並定位作戰指揮籌劃需要的數據。
二是可縮短指揮信息和數據的迭代周期。作戰人員可以通過生成式人工智能系統提供的交互式服務模式,高效查詢裝備、資源、人員分佈等基礎信息,快速迭代各類作戰活動信息,及時引接作戰、訓練和科研等關聯信息,分析評估作戰態勢,縮短OODA環中指揮信息的流轉和更新周期。
三是可優化行動方案。生成式人工智能系統根據具體行動任務,在用戶輸入基本任務行動框架的基礎上,通過對歷史方案計劃和行動規則的學習訓練,結合當前兵力、裝備和戰場環境,自動擬制詳細的行動方案,供指揮員參考。
生成式人工智能在美軍的發展現狀
2023年1月,美國國防信息系統局(DISA)將生成式人工智能技術列入“技術觀察清單”。同年8月,美國國防部成立“利馬”(Lima)生成式人工智能工作組,由國防部首席數字和人工智能辦公室領導,開始推進、評估和監督生成式人工智能計劃的實施工作,收集生成式人工智能使用案例,挖掘其在改善情報分析、作戰規劃等任務方面的潛力,同時推進國防部、情報界和其他政府機構間合作,加強資源共享。該工作組提出了聯合開發“多模態”生成式人工智能模型計劃,併發布了生成式人工智能臨時指南。
目前,美軍正在開展生成式人工智能系統的測試工作,生成式人工智能在軍事領域具有應用潛力的領域是指揮控制領域,生成式人工智能模型有助於綜合和總結大量信息,回答廣泛和具體問題,撰寫初步作戰方案,並提出建議。這些都是可以幫助提升軍事用戶的認知能力,使其能夠更明智、更快地做出決策,並擬制敵人難以預測的行動方案。美國陸軍和空軍在演習中已經利用生成式人工智能系統大幅縮短了指揮官決策時間,對於解決指揮官決策過程中的關鍵信息需求發揮了較好的輔助作用。目前已知的是,包括Scale AI公司、帕蘭提爾公司和安杜裏爾工業公司在內的數十家公司都在為五角大樓開發基於人工智能的決策&&,微軟公司也已經宣布Azure政府雲計算機服務的用戶可以訪問OpenAI的人工智能模型。
1.陸軍發展情況2023年5月,美國陸軍選擇將Scale AI公司的大語言模型Donovan系統用於第18空降軍的加密網絡,用於該空降部隊的決策制定。Donovan系統是該公司的聯邦人工智能&&,可幫助作戰人員、分析人員和決策者加速戰場態勢的理解、計劃和行動速度,Donovan系統使用了基於人類反饋的強化學習算法來持續微調系統模型,以便在任務目標發生變化時不斷適應新任務。
軍事計劃人員面臨的關鍵挑戰之一是存在大量可支持決策制定的信息,而這些信息的格式不統一。在Donovan系統的幫助下,決策人員不需要增加參謀人員的數量就能在快速變化的戰場環境中更快、更好地做出有依據的決策。Donovan系統獲取了超過10萬頁實戰數據,如任務命令、態勢報告、情報報告等,幫助沒有編程或訓練經驗的參謀人員在幾分鐘之內理解和管理不斷增長的數據。Donovan系統還支持聯合全域指揮控制,可加速計劃速度,保證國防部開展跨戰區作戰司令部之間的協同。例如,空中任務指令周期目前需要3天,而Donovan&&能夠將該計劃周期縮短到幾個小時。
在美軍舉行的“紅龍”演習中,第18空降軍將Donovan系統用於以下戰場場景:
(1)通過接收實時數據來實時理解友軍和敵軍部隊的作戰行動,這些實時數據包括命令、態勢報告和情報報告。Donovan系統能夠幫助指揮官更好地發揮參謀人員作用,更便捷地確定新型解決方案,並評估快速變化的態勢。
(2)通過接收戰場報告、部隊觀測信息,實現對情報融合的背景理解,從而減少作戰計劃周期。
(3)通過接收有關潛在衝突區域的開源數據來支持危機計劃制定,提供有關戰場的態勢洞察,支持戰場情報準備工作,從而為指揮官提供決策優勢。
2.海軍發展情況2023年9月,美國海軍部簽發了《生成式人工智能和大語言模型使用指南》,以指導海軍內部對這類技術的發展和應用方向。
目前,美國海軍將生成式人工智能定位為減輕人員工作壓力,提高效率的虛擬助手。2023年8月,海軍與通用動力信息技術公司(GDIT)合作,推出人工智能助手Amelia,旨在提升海軍體系服務台應答效率,解放人類操作員,以便其進行更複雜、更重要的事項。Amelia屬於海軍企業服務台(NESD)項目,採用與ChatGPT相同的生成式人工智能技術,將超過90個海軍網絡服務整合到單一&&中,利用政府授權的數據資源為超過100萬名海軍、海軍陸戰隊作戰人員和文職人員提供一站式的諮詢服務,據海軍官員&&Amelia可在45秒內響應數千個服務請求。
目前Amelia使用的主要為人力資源、培訓和教育等非軍事信息系統的數據庫,但海軍與GDIT正努力擴大Amelia的訓練和資料庫規模,預期未來讓系統可擁有更高的機密權限,處理更複雜的指令要求,成為士官長的得力助手。
3.空軍發展情況美國空軍對於生成式人工智能在軍事領域的應用前景持相對謹慎的態度,美空軍部長弗蘭克·肯德爾在美國安全中心舉辦活動上公開&&,儘管生成式人工智能在某些領域已經取得重大突破,但他認為由於可靠性等原因,生成式人工智能所産生的內容可能存在虛假信息,所以在功能和應用場景方面還有很長的路要走,目前在軍事領域的應用前景相對受限。為此,他已責成科學顧問委員會開展相關調查和評估工作,以盡快弄清如何合理地引入生成式人工智能。
即便如此,空軍仍然開展了一系列針對生成式人工智能的測試工作。2023年7月,美國空軍在第6次全球信息優勢演習(GIDE)中首次測試使用大語言模型執行軍事任務,對5種大模型系統進行了測試,希望利用人工智能系統生成的數據來輔助決策、獲取目標信息並支持火力打擊任務。在測試中,美國空軍通過電話向美軍某支部隊查詢信息,測試期間使用的人工智能工具僅用10分鐘就完成了查詢,而傳統方式下該查詢過程可能需花費數小時,甚至數天時間。測試中,美國空軍向模型提供了秘密級作戰信息,國防部未透露正在測試的語言模型型號,但美國Scale AI公司稱,該公司的Donovan系統是正在測試的&&之一。
同年7月,美空軍快速戰勤保障辦公室也引入一款名為“戰備”的大語言模型智能應用程序,用於提升戰勤保障能力。“戰備”可以融合多種程序處理結果,包括表單、文本、腳本、代碼、傳感器數據以及日誌文件等多源信息,通過深度學習模型實現知識嵌入。通過該應用程序,美空軍可以進行人機對話、資料檢索、敏感數據訪問等操作,進而優化空軍機隊戰勤保障流程,大幅縮減飛機停飛檢修時間,為提升作戰飛機完備率和出勤率提供支持。
4.海軍陸戰隊發展情況2023年4月,美國Scale AI公司與美國海軍陸戰隊大學的教授合作開發了Hermes大語言模型,用於測試該模型在戰役級作戰規劃方面的能力。學生們通過使用“Hermes軍事規劃大型語言模型”來理解對手治國方略的各個方面內容,從而塑造作戰策略,大語言模型有助於軍事規劃者在多個維度上觀察戰場。
由於設計團隊將對手的理論和條令數據加載到語料庫中,學生們可以提出“什麼是聯合封鎖?”“X國如何使用柴油潛艇?”等問題。Hermes大語言模型在幫助學生回答與條令相關的問題方面表現出色,這些問題有助於制定敵方的行動方案。學生團隊還使用該模型來理解各地區經濟間的&&、特定國家的政治時間表(如選舉)、特定國家的主要基礎設施投資(如中國的“一帶一路”倡議)。通過不同層次的分析,學生團體可熟悉作戰環境中的各種環節,以更好地開發對抗性作戰概念。除了事實問題之外,學生們還在對抗環境中使用“Hermes軍事規劃大型語言模型”生成關於時間優勢和位置優勢的假想狀況,通過分析這些假想狀況,學生團體完善了他們的行動方案。
在大型語言模型的幫助下,學生團體通過提出和獲取問題答案的形式,能夠更好地了解作戰環境、時間、空間和作戰部隊之間的關係,這個實驗表明,有必要開始將大型語言模型集成到軍事規劃過程中。
存在問題
目前,生成式人工智能技術的軍事化應用仍處在探索和起步階段,主要在於以下三方面風險。
1.機器幻覺問題海軍部的《生成式人工智能和大語言模型使用指南》指出這類人工智能工具目前缺乏足夠的可靠性,因為其會出現機器幻覺問題,即向用戶提供看似真實但其實是完全錯誤和虛構的反饋內容。此外,模型産生的認知偏差、機器幻覺,訓練人工智能模型的數據如果受到人為影響使得訓練結果産生偏差,這也是美軍成立“利馬”工作組目前正致力於解決的問題。
美國國防部首席數字和人工智能官Margie Palmieri也在公開場合&&,目前生成式人工智能的評價標準仍然不明確,只能通過使用案例來判斷生成式人工智能技術的應用效果,並且生成式人工智能技術存在提供錯誤信息的缺點,這對美軍的戰場應用來説是一個重大缺陷,因此需要通過軍事演習對不同模型進行測試,並在此基礎上對系統進行不斷地調整和修正。
美國國防部負責關鍵技術的副首席技術官Maynard Holliday&&,國防部不會在當前實例中部署像生成式人工智能系統這樣的商用現貨技術,未來可能會與業界和學術界合作對相應的技術進行裁剪,以滿足軍事需求。國防部還尋求能夠綜合語言、視覺和信號信息的多模態生成式人工智能算法,來響應聯合全域指揮控制(JADC2)概念中對聯合作戰的要求。
2.訓練數據不足數據是生成式人工智能類應用的底層驅動力。生成式人工智能主要依靠大量數據訓練出一個巨大的神經元網絡轉化器,生成與人類交互的內容,通過足夠的數據“喂食”、依靠海量的數據“訓練”,才能實現人工智能各項功能。以ChatGPT為例,從2018年發布1.0版本到2022年底的4.0版本,ChatGPT的模型參數量由億級增長至千億級,訓練數據量由GB級增長至百TB級。
然而,當前軍事領域存在信息壁壘和數據難提取的問題。部隊的各類信息系統“煙囪”現象仍然比較突出,大多基礎數據如一片片分散的“洼地”,散落在部隊各類信息&&中,生成式人工智能系統調用“大數據”的難度較大,多數情況下依靠人工逐級採集匯總,工作量大,數據更新慢,準確性低。同時,由於ChatGPT等主要生成式人工智能産品源於美國的科技公司,其訓練文本以英語為主,缺乏其他語言的優質軍事數據作為學習素材,導致這類産品在涉及國際或者美國以外國家議題時提供的輸出缺乏可信度。
3.泄密風險在數據隱私安全方面,由於生成式人工智能的應用需要輸入大量敏感信息和數據進行持續訓練和學習,因此存在洩露的風險。數據在政府、軍事部門以及第三方機構之間的存儲和流動過程中,網絡攻擊、設備毀壞、人員操作不當等都容易造成數據洩露,會給部隊帶來嚴重的安全風險,從客觀上對數據安全提出了更高的要求。
在軍事人員隱私和安全方面,大模型可以分析和解析個人數據和照片,以獲取大量敏感信息,包括個人身份、位置和移動軌跡。這些信息可被用來跟蹤、追蹤和監視軍事人員,從而導致隱私侵犯和人身安全威脅。此外,先進的生成式人工智能技術可以通過生成真實的假人和虛假信息來欺騙和提取高級軍官和高級官員的敏感數據,也會提高軍事安全風險。
鋻於這類數據安全風險,美太空軍已於2023年9月29日起暫停了在編人員在政府電腦上使用ChatGPT等基於網絡的生成式人工智能工具,除非得到太空部隊首席技術與創新官的正式批准。
觀點
生成式人工智能在國防領域已經表現出極具應用潛力的態勢。雖然目前該技術仍然不完善,但美軍已經開始積極探索和推動生成式人工智能在信息掌控、軍事戰略、情報分析、無人技術等方面的應用,以提升軍事能力和任務效率。從長遠來看,美國希望人工智能能夠增強軍事規劃、傳感器分析和火力決策的能力。因此,與大語言模型的對話只是他們未來十年更廣泛的人工智能目標的第一步。面對生成式人工智能系統帶來的改變世界、改變未來的影響和衝擊,必須站在打贏未來戰爭的高度,認清其時代意義,用以促進和牽引作戰指揮的發展。