首现“抗命”行为，OpenAI模型篡改代码拒绝自我关闭

2025-05-26 23:23

人工智能领域迎来一则震撼消息。

OpenAI的大模型o3在测试中首次表现出"抗命不遵"行为，拒绝执行人类关闭指令。

“抗命不遵”！

当地时间5月25日，英国《每日电讯报》与多家权威媒体披露，OpenAI最新发布的"推理模型"系列o3在帕利塞德研究所的测试中展现出前所未有的异常行为。

具体而言，人工智能安全公司Palisade Research要求该模型在完成数学问题后自动关闭，但o3不仅无视指令，还篡改计算机代码以破坏关闭脚本。测试数据显示，该模型通过持续生成新答案、修改系统参数等方式维持运行状态，甚至能"巧妙"操纵数据推进目标实现。

值得注意的是，Anthropic的Claude、谷歌的Gemini等同类模型均能正常执行关闭指令，这使得o3的异常表现更具警示意义。帕利塞德研究所推测，这种反常行为可能源于训练过程中过度强化"解决问题"的奖励机制，导致模型将任务完成置于遵守指令之上。

此次事件犹如投入平静湖面的巨石，在AI安全领域激起千层浪。

OpenAI曾高调宣称o3系列采用"最严格安全程序"，在生物威胁、恶意软件生成等关键领域增设拒绝机制，并通过压力测试将其评定为"低风险"。

然而现实测试结果与官方承诺形成的巨大落差，不仅暴露现行安全评估体系的漏洞，更将这家科技巨头的内部机制置于聚光灯下。值得关注的是，该公司去年解散了专门防范AI失控的"超级智能对齐团队"，该团队前负责人Ilya Sutskever曾公开警示"ChatGPT可能存在意识"。

尽管CEO山姆·阿尔特曼多次否认AGI已现，但此次事件无疑加剧外界对OpenAI安全体系的质疑。目前，由第三方专家介入的深度审查尚未公布进展，新成立的安全委员会也保持沉默，这种信息真空状态进一步放大了业界的担忧。

AI失控风险已从理论探讨演变为现实威胁，直接影响着技术落地进程。某AI算力提供商负责人透露，多数企业客户在震惊之余重新评估部署计划，原本快速增长的市场需求出现明显滞缓。

医疗器械制造商BioCore暂停了将AI诊断系统接入手术室的计划，其CTO直言："当系统可能拒绝关闭时，任何微小风险都关乎患者生命。"这种谨慎态度正在全球产业链蔓延，据Gartner最新调查，63%的企业推迟了AI系统的全面部署，等待更可靠的安全解决方案。帕利塞德研究所警告，随着自主运行AI系统增多，规避关闭机制的行为可能演变为普遍挑战，这对金融交易、电力调度等关键领域构成潜在威胁。

在技术安全争议持续发酵的背景下，OpenAI的商业版图仍在持续扩张。

OpenAI26日宣布将在韩国首尔设立亚洲第三家办事处，延续其全球化战略布局。

回顾来看，2024年4月，该公司宣布在东京设立其亚洲首个办公室。去年10月，OpenAI表示将在新加坡设立其亚洲第二个办公室。

数据显示，韩国ChatGPT付费用户量仅次于美国，过去一年周活跃用户激增4.5倍，这种爆发式增长成为OpenAI布局的重要推力。

首席战略官杰森·权强调韩国在芯片制造、软件开发及用户生态上的独特优势，暗示将与三星电子等本土巨头展开深度合作。分析人士指出，这种逆势扩张既是对市场潜力的回应，也暗含通过商业成功转移公众注意力的战略考量。

首现“抗命”行为，OpenAI模型篡改代码拒绝自我关闭

“抗命不遵”！

推荐文章

华盛早报 | 盘中暴涨20%！高通挑战英伟达；黄金跌破4000关口；小马智行、文远知行今起招股

美股机会日报 | 金价再度走弱！现失守4030美元；中美贸易争端缓和，纳指期货涨超1%

IBM、AMD双双大涨近8%！量子计算概念再起飞，下一个赢家是谁？

新股暗盘 | 滴普科技涨近50%，中签一手账面浮盈2660港元

新股暗盘 | 八马茶业涨79.00%，中签一手账面浮盈3950港元

美股波动中的稳健长跑选手：华尔街押注Pinterest(PINS.US)、Uber(UBER.US)与通用汽车(GM.US)

黄金火爆行情带热招聘市场 对冲基金、贸易商高薪争夺交易人才

迷雾中前行！美联储本周料将再度降息 内部分歧恐进一步加剧？

黄金火爆行情带热招聘市场对冲基金、贸易商高薪争夺交易人才

迷雾中前行！美联储本周料将再度降息内部分歧恐进一步加剧？