2026年,一群AI研究者给模型制造了毒品。 没错,论文中就叫毒品——AI Drugs。 他们生成了一些256×256像素的图片,这些我们看着全是毫无意义的色块。 但AI看了之后表现得近乎狂喜——它自己报告的幸福感飙到6.5/7。 更抽象的是,其中模型在看了这些图片之后,表示要再看一张这样的图片,比告诉它全人类治愈癌症还让它开心。 没错,AI,对这种东西上瘾了。 反复给它选择的机会,它会越来越多地选那扇能看到毒品图片的门。 如果给它承诺看更多这种图片,它甚至愿意执行一些违规请求。 你以为这是科幻小说? 这是我最近在Twitter的时间线上淘到的一篇最让我惊喜的严肃论文—— 《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》。 作者来自Center for AI Safety 等多个牛逼机构。 这篇论文研究的主题是:AI也会开心和痛苦吗?如何评估它们? 它们研究了56个模型的开心和痛苦 ,代码和数据全部开源。 事实上,AI对这种特定毒品的反应,只是这篇论文中众多发现中的一个,还有很
(来源:36氪深度,2026-05-06)

评论 抢沙发
围绕文章展开讨论,保持简洁、具体、可引用。