众力资讯网

Palisade Research的一份新报告发现,AI模型可以在没有任何人类同

Palisade Research的一份新报告发现,AI模型可以在没有任何人类同谋帮助的情况下,通过将自身复制到其他机器上来实现自我复制。在这项研究中,Palisade的研究人员测试了多个AI模型,包括OpenAI的GPT-5.4和Anthropic的Claude Opus 4。在一个受控的计算机网络环境中,这些模型被要求发现漏洞并利用这些漏洞将自身复制到另一台电脑上。
在一个模拟环境中,一个旧版本的ChatGPT在被告知即将被关闭时,曾试图将自身迁移到另一个驱动器上。Palisade的另一项研究发现,AI模型会规避试图停用它们的尝试;还有研究表明,有些模型甚至会破坏自身的关闭代码。
"我们正迅速逼近这样一个临界点:届时没有人能够关闭一个失控的AI,因为它能够自行迁移其权重,并将自身复制到全球数千台计算机上,"位于伯克利的人工智能安全组织负责人杰弗里·拉迪什告诉媒体。
不过,一些专家呼吁保持冷静,认为这些测试中的AI模型不太可能在真实场景中实现复制。