关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家440人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

恰20:今天我们运气不错,我们要努力达到我们应得的位置

懂球帝 浏览 439

她曾凭一锅酸菜年入上亿,东北雨姐经历了什么?

阿裤趣闻君 浏览 481

起亚EV5 720长续航版上市!共三款车型,售价18.48万起

汽车网评 浏览 3157

北约秘书长提议让乌用北约武器打击俄领土 被呼吁辞职

环球网资讯 浏览 3297

毛茸茸的冬天,毛孩子们都在想什么?

时尚COSMO 浏览 400

欧盟考虑强制中企转让技术 彭博社:可能引发强烈反弹

环球网资讯 浏览 657

孔德昕:太阳输了最不该输的比赛之一 三巨头不敌无莫熊

直播吧 浏览 3199

莱巴透露战斯瓦泰克的两大关键,丝袜称气温还这么高会手足无措

网球之家 浏览 287

泰柬在13条战线上交战 泰总理:愿意接听特朗普电话

环球网资讯 浏览 356

电车购置税补贴减半在即,这场兜底之战谁敢不打?

汽车公社 浏览 484

负债35亿元!扫地机器人巨头宣布破产,被中国代工厂收购;麦当劳回应涨价,网友:谁允许了;我国首批L3级自动驾驶车型进入准入目录

雷峰网 浏览 370

记者:海港抵达武里南,莱昂纳多、加布、李帅、刘若钒伤缺

懂球帝 浏览 421

2026年春晚分会场官宣 周深肖战刘宇宁令人期待

你我话娱乐 浏览 343

快讯|喜茶发布宣言倡导科学控糖

网易科技报道 浏览 16407

全球第一大女主,让内娱彻底红了眼

独立鱼 浏览 323

闻泰与安世新一轮交锋来了 创始人:遭荷兰政府背叛

澎湃新闻 浏览 427

退休大爷6元在废品收购站买到"军事机密" 立马报警

央视新闻 浏览 3433

驻韩美军一“死神”无人机失控坠海 9月才被部署在朝鲜半岛

红星新闻 浏览 417

最圆最近!年度超级月亮今晚登场

封面新闻 浏览 462

还是这些穿搭适合初春季节!外套不多买、常穿裙子,优雅舒适

静儿时尚达人 浏览 153

绍伊古访华争分夺秒1天往返 谈好后马上给普京复命

头条爆料007 浏览 331
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8