主權級大模型,AI博弈新場域
文 | 韓卓希 北京大學全球互聯互通研究中心助理研究員、劉學洋 北京大學軟件工程國家工程研究中心副教授
英偉達GTC年度開發者大會正在舉行,市場普遍將之視為世界AI發展的一個風向標。這一行業熱潮,也折射出全球AI競爭日趨白熱化。自ChatGPT問世后,多國紛紛跟進大語言模型技術,圍繞“主權級大模型”的全球戰略博弈也隨之拉開序幕。
當前,大模型訓練高度依賴海量高質量數據和人類反饋強化學習技術。這兩大技術特點,使得通過調整訓練數據、引導人類反饋偏好,向大模型注入特定觀點和價值觀成為可能。這也直接催生了“主權級大模型”的概念。
主權級大模型的“主權”屬性,要求該模型需與國家立場對齊。技術政治時代,主權級大模型與一國國家安全、國家戰略緊密相連。中國的區域國別學可為訓練這類大模型構建高質量且安全的訓練數據集,促使主權級大模型進一步對齊國家立場,服務國家戰略。
主權級大模型是國家統籌發展和安全的關鍵基礎設施。當前,大模型被認為是AI領域最重要的軟件基礎設施,是可能通向通用人工智能的主要技術途徑。由此而來的一個事關國家戰略的核心問題是:如果使用開源模型,那么由誰掌控訓練數據?其訓練數據是否直接關乎一個國家的文化、經濟、安全?正因如此,各國愈發關注自主人工智能,力爭自主掌握并運用人工智能技術帶來的戰略優勢。
自主人工智能包含兩大支柱:物理基礎設施和數據基礎設施,后者的核心正是主權級大模型。根據業內的普遍理解,主權級大模型是由本土團隊開發、使用本地數據集訓練的大型語言模型。也就是說,該大模型符合研發國的政治制度、文化、宗教和價值觀,是該國重要的人工智能基礎設施。其優勢在于能夠有效保障國家的數據隱私和安全,無需過度依賴他國開發的人工智能大模型。目前,很多國家宣布構建服務自身的主權級大模型。比如,法國初創公司Mistral AI成立僅兩年,就宣布與英偉達合作推出專注于人工智能的主權計算基礎設施。可以說,發展主權級大模型等自主的人工智能能力被視為確保一國“數字主權”的關鍵。
主權級大模型與國家安全能力建設緊密相關。一方面,因“主權”屬性,大模型擁有使用國政治、經濟、軍事等多方面數據,對該國制定發展戰略、維護國家安全等相關舉措具有直接而重大的影響。此外,融入一國社會運行、發展的主權級大模型,可對該國文化起到“編碼”的作用。大模型所依賴的數據庫,直接決定其如何塑造國民對自身與世界的認知,這也是“主權”屬性的另一層含義。其不直接攻擊物理或技術系統,而是從深層次上改變人們對世界的理解與行為邏輯。西方國家對該領域有較多論述與設計,先后發展出輿論戰、心理戰、認知戰、模因戰等概念及相關策略。
另一方面,缺乏自主可控的主權級大模型,會直接危及一國國家安全。受技術、資金以及基礎設施等限制,部分發展中國家尚不具備自主構建主權級大模型的能力。主權級大模型能夠提供遠超人力的強大算力,以更為客觀、可量化的方式來分析國內輿論態勢、經濟社會走勢以及其他國家外交政策走向等,進而為國家戰略決策提供參考乃至發揮預警作用。不掌握主權級大模型的國家很可能陷入“落后挨打”的處境,國際秩序中將因此出現國與國“AI主權”不平等的現象。就此而言,有能力構建主權級大模型的國家,有責任幫助缺乏條件的國家建設屬于自己的主權級大模型。
主權級大模型的“主權”屬性,要求該模型必須服務國家戰略并體現使用國價值觀。該模型并非僅僅將特定國家數據進行統一整理,而是基于該國獨特的數據、研究和歷史,通過對數據進行專業性標注、清洗,訓練而成的、能夠體現該國特色的工具。區域國別學的初衷是服務國家戰略,與主權級大模型的“主權”屬性要求一致,可為主權級大模型提供高質量大數據集及系列訓練邏輯。
區域國別學能夠為主權級大模型構建注入結構化、系統化的知識圖譜,例如評估關鍵海峽通道的地緣政治風險、不同國家間領土爭端現狀與歷史脈絡、一國國際形象在特定地區傳播效果等。
更重要的是,區域國別學學者能夠憑借自身語言能力、專業基礎,對海量數據進行甄別、清洗、標注以及評估,有效識別信息操縱,規避敏感議題,構建一個高質量且安全的訓練數據集。在互動過程中,區域國別學不僅可為主權級大模型訓練提供數據支撐,更可將該學科的分析邏輯、推理框架等一并輸入,使大模型形成對齊國家立場的本地標準與分析體系。









