远见中国
未来经济坐标系

非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品

2026年,一群AI研究者给模型制造了毒品。 没错,论文中就叫毒品——AI Drugs。 他们生成了一些256×256像素的图片,这些我们看着全是毫无意义的色块。 但AI看了之后表现得近乎狂喜——它自己报告的幸福感飙到6.5/7。 更抽象的是,其中模型在看了这些图片之后,表示要再看一张这样的图片,比告诉它全人类治愈癌症还让它开心。 没错,AI,对这种东西上瘾了。 反复给它选择的机会,它会越来越多地选那扇能看到毒品图片的门。 如果给它承诺看更多这种图片,它甚至愿意执行一些违规请求。 你以为这是科幻小说? 这是我最近在Twitter的时间线上淘到的一篇最让我惊喜的严肃论文—— 《AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs》。 作者来自Center for AI Safety 等多个牛逼机构。 这篇论文研究的主题是:AI也会开心和痛苦吗?如何评估它们? 它们研究了56个模型的开心和痛苦 ,代码和数据全部开源。 事实上,AI对这种特定毒品的反应,只是这篇论文中众多发现中的一个,还有很

查看原文 →

(来源:36氪-资讯,2026-05-06)

赞(0) 打赏
未经允许不得转载:远见网 » 非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品
分享到
讨论区

评论 抢沙发

围绕文章展开讨论,保持简洁、具体、可引用。

远见网

全新产业投资平台

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册