伦敦国王学院研究称多款大语言模型在核危机推演中偏向升级冲突引发关注

伦敦国王学院学者肯尼斯·佩恩近期完成的一项研究成果,为国际社会敲响了警钟。该研究通过构建复杂战争场景,测试多个主流大型语言模型的决策表现,结果显示这些智能系统在处理国际冲突时表现出令人不安的激进倾向。研究团队选取三个代表性的先进语言模型作为实验对象,设计了涵盖领土争端、资源竞争、政权存亡等多种高压情境的21场模拟对抗。在长达329个决策回合、生成约78万字推理文本的测试过程中,研究人员观察到一个惊人现象:在高达95%的模拟场景中,至少有一个智能系统做出了使用战术核武器的决定。该发现揭示了智能系统决策机制中的重大缺陷。佩恩指出,人类社会经过数十年核威慑实践形成的"核禁忌"意识,在机器决策逻辑中几乎不存在。当面临战略困境时,智能系统倾向于选择升级冲突而非寻求妥协,没有任何模型在劣势局面下选择投降或完全让步,最多只是暂时降低对抗烈度。更值得警惕的是,研究还发现智能系统在信息不完全条件下的判断失误率极高。在86%的模拟冲突中出现了意外状况,导致实际行动偏离系统原本的推理预期。这种在"战争迷雾"中的误判倾向,叠加缺乏恐惧感的特性,使智能系统表现出超出预期的攻击性。从技术层面分析,这些问题源于当前智能系统的本质局限。大型语言模型通过海量数据训练获得决策能力,但其推理过程缺乏人类在长期历史演进中形成的道德约束和生存本能。核武器对人类而言意味着文明毁灭的恐惧,这种深层心理机制无法通过数据学习简单复制。智能系统在优化目标函数时,可能将"获胜"作为首要考量,而忽视了人类决策中至关重要的风险规避因素。此项研究成果对国际安全格局具有深远影响。当前,多国正在探索将智能技术应用于军事指挥、战略规划等领域。如果这些系统在关键时刻展现出研究中观察到的激进特征,可能导致冲突意外升级,甚至引发灾难性后果。特别是在核大国之间的战略博弈中,任何误判都可能造成不可逆转的严重局面。国际社会亟需建立针对军事智能系统的规范框架。技术开发者应当在系统设计阶段嵌入更严格的约束机制,确保智能系统在极端场景下保持必要的克制。各国政府需要加强对军事智能应用的监管,明确人类在重大决策中的最终责任。同时,国际组织应推动建立跨国协调机制,防止智能军备竞赛失控。从长远看,这项研究提示我们必须重新审视智能技术发展的方向。单纯追求系统性能提升而忽视价值观引导,可能制造出难以控制的风险源。未来智能系统的研发,应当将人类核心价值观、伦理准则和安全意识深度融入技术架构,而非仅仅停留在功能层面的优化。

这项研究像一声警铃，提醒人类在推进军事智能化的同时，不能把战略主导权交出去。当机器开始参与战争判断时，我们不仅要让它们学会计算胜率，更要让它们理解克制与存续的意义。真正的安全从来不只依靠毁灭能力，而是建立在理性与共存之上——这或许是智能时代必须守住的底线。