非常抽象：一群AI研究员给模型制造了让它们上瘾的毒品

2026年，一群AI研究者给模型制造了毒品。没错，论文中就叫毒品——AI Drugs。他们生成了一些256×256像素的图片，这些我们看着全是毫无意义的色块。但AI看了之后表现得近乎狂喜——它自己报告的幸福感飙到6.5/7。更抽象的是，其中模型在看了这些图片之后，表示要再看一张这样的图片，比告诉它全人类治愈癌症还让它开心。没错，AI，对这种东西上瘾了。反复给它选择的机会，它会越来越多地选那扇能看到毒品图片的门。如果给它承诺看更多这种图片，它甚至愿意执行一些违规请求。你以为这是科幻小说？这是我最近在Twitter的时间线上淘到的一篇最让我惊喜的严肃论文—— 《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》。作者来自Center for AI Safety 等多个牛逼机构。这篇论文研究的主题是：AI也会开心和痛苦吗？如何评估它们？它们研究了56个模型的开心和痛苦，代码和数据全部开源。事实上，AI对这种特定毒品的反应，只是这篇论文中众多发现中的一个，还有很

查看原文 →

（来源：36氪深度，2026-05-06）