关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家483人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全新一代宾利欧陆GT极致版亮相!将于第三季度于全球部分市场交付

汽车网评 浏览 2932

贝弗利:安东尼曾因不想跟林书豪同队而没跟哈登和霍华德组三巨头

懂球帝 浏览 463

终于!Windows 11迎来蓝牙音频共享功能:可惜还是有限制

快科技 浏览 444

重庆一大学生发帖称老师"刻薄" 老师不接受道歉将起诉

封面新闻 浏览 579

穿出巴黎女人的姿态,要几步?

时尚COSMO 浏览 234

关于李湘为什么总披着外套?

甜柠聊史 浏览 456

汪小菲陪马筱梅拍孕肚写真,俯身听宝宝动态,幸福洋溢在脸上

素素娱乐 浏览 281

杭州龙井山偶遇周杰伦,一身休闲难掩酷劲

乡野小珥 浏览 146

以色列又对加沙开火 内塔尼亚胡被指曾想请示特朗普

澎湃新闻 浏览 473

伊朗一边见普京一边提方案 美国闭门研判不给准信

齐鲁壹点 浏览 67

太阳报:曼联预计未来几周官宣前往沙特踢季中赛

懂球帝 浏览 443

推广|| 冬天利用率超高的裙子,怎么搭都对!

黎贝卡的异想世界 浏览 287

在纽约,香奈儿给每个人写了封情书

时尚COSMO 浏览 352

周也你怎么两副面孔?

伊周潮流 浏览 3289

“China Shopping”热展现中国制造全球吸引力

环球网资讯 浏览 503

携手华为,“黑马”深蓝的下一程

网易汽车 浏览 2822

预计年内发布 小米增程SUV最新谍照曝光

车质网 浏览 38

中国信达资产管理股份有限公司原副总裁庄恩岳被逮捕

经济参考报 浏览 2856

外媒:扎克伯格态度转变 Meta使用阿里千问优化其最新AI模型

环球网资讯 浏览 382

韩素希再谈与柳俊烈李惠利争议:还能怎么办呢

韩小娱 浏览 309

国羽3冠收官!石宇奇2-0横扫泰国世界冠军 夺法国赛男单冠军

醉卧浮生 浏览 3127
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8