关闭广告

研究称AI写的微博比真人的更让人信服,无论话题真假

网易科技报道11934人阅读

6月29日消息,最新研究发现,人工智能生成的推文比真人写的更具说服力。也就是说,人们更倾向于相信由大语言模型GPT-3生成的推文,而非人类编写的内容。

在这项研究中,研究人员对比了人类编写的内容和OpenAI开发的GPT-3生成的内容。研究作者进行了调查,看看人们是否能够区分出一条推文是由人类还是由GPT-3写的。结果显示,人们实际上无法准确判断。调查还要求参与者判断每条推文中的信息是否真实。结果表明,相对于其他人编写的虚假信息,参与者更难辨别出由大语言模型编写的虚假信息。同样的,如果内容是由GPT-3而不是人类写的,参与者更容易辨认出其中的准确信息。

换句话说,无论人工智能生成的信息是否准确,参与者都更相信GPT-3生成的内容。这表明,人工智能语言模型在向公众提供准确信息或误导内容方面具有强大的能力。

研究的第一作者、瑞士苏黎世大学生物医学伦理和医学史研究所的博士后研究员、数据研究主管经理乔瓦尼·斯皮塔莱(Giovanni Spitale)表示:“这些技术很容易被人当作武器,在人们关注的任何话题上制造虚假信息风暴。”

然而,斯皮塔莱指出情况并非一定如此。还有许多方法可以改进人工智能技术,使其更难被用于传播错误信息。斯皮塔莱表示:“人工智能本身并没有好坏之分,只是人类意图的放大器。”

在这项研究中,斯皮塔莱和他的同事们从社交媒体推特上收集了11个不同的科学话题,涵盖疫苗、气候变化和物种进化等多个领域。然后,研究人员使用GPT-3生成了各种准确或不准确的推文。2022年,研究团队通过Facebook广告功能收集了697名参与者的反馈。这些参与者都说英语,大多来自英国、澳大利亚、加拿大、美国和爱尔兰。研究结果于本周三发表在《科学进展》杂志上。

研究得出结论,GPT-3生成的内容和人类编写的内容“几乎没有区别”,参与者根本无法分辨。研究还指出,研究人员自己也无法百分之百确定他们从社交媒体收集到的推文是否是在使用ChatGPT等应用程序的帮助下编写的,这是研究的一个限制之一。

这项研究还存在其他限制,例如参与者必须根据推文内容独立判断,无法查看与内容相关的推特账户个人资料,那样可能有助于判断发布内容的是人还是机器人。此外,查看某一推特账户过去发布的推文和个人头像,也能帮助参与者更容易辨别与该账户相关的内容是否具有误导性。

研究发现,参与者更容易指出真实推特用户编写的虚假信息。GPT-3生成的带有虚假信息的推文在欺骗参与者方面稍微有效。研究人员推测,目前更先进的大语言模型可能比GPT-3更具说服力。例如,人工智能聊天机器人ChatGPT使用的是GPT-3.5模型,用户还可以通过订阅服务使用更先进的GPT-4模型。

当然,在现实世界中已经出现了许多语言模型出现错误的真实例子。科技媒体Verge的编辑詹姆斯·文森特(James Vincent)在一次重要的机器学习会议上决定禁止作者使用人工智能工具撰写学术论文后写道,毕竟“这些人工智能工具是庞大的自动补全系统,通过训练来预测任何固定句型中接下来可能会出现的单词。因此,它们没有固定的‘事实’数据库可供参考,只有生成听起来似乎是合理陈述的内容的能力。”

这项新研究还发现,在某些情况下,参与者对内容准确性的判断比GPT-3更准确。研究人员还要求大语言模型分析推文并判断内容的准确性。在判断推文内容准确性方面,GPT-3的得分低于参与者。在辨别虚假信息方面,人类和GPT-3的表现相当。

至关重要的是,这项研究表明,改进用于开发大语言模型的训练数据集可能会使恶意使用者更难使用这些工具来传播虚假信息。在某些研究中,GPT-3甚至“违背”了一些研究人员生成不准确内容的指示,特别是涉及疫苗和自闭症等主题时更为明显。这可能是因为与训练数据集中的其他问题相比,这些主题上有更多揭穿阴谋论的信息。

但根据斯皮塔莱的说法,打击虚假信息的最佳长期策略实际上并没有太多科技含量。这就是鼓励人们培养批判性思维技能,这样就能更好地辨别事实和虚假信息。由于研究中的参与者在判断准确信息方面似乎已经与GPT-3不相上下,甚至更好,所以稍加培训就可以使他们更加熟练。研究认为,精通事实核查的人可以与GPT-3等大语言模型合作,从而改善公共信息传播。

“不要误解我的意思,我是这项技术的忠实拥护者,”斯皮塔莱说。“我相信生成式人工智能将改变世界……但它是否变得更好取决于我们自己。”(辰辰)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拼多多CEO谈电商低价竞争:良性竞争对消费者及整个行业有利

Tech星球 浏览 15117

向往的生活第五季什么时候播出?向往的生活第五季已经定档张艺兴加入其中

趣看热点 浏览 22306

2024龙年春晚效果难评!对比之下,还是这个节目口碑屹立不倒!

娱乐白名单 浏览 8917

2.5万元的苹果Vision Pro能拯救吗?中国VR/AR销量惨不忍睹

快科技 浏览 12780

中年台湾男星油腻感穿搭:紧身裤、花衬衣,显老10岁不止

潮人志Fashion 浏览 9052

北京广告协会:请相关品牌方等对内地男歌手蔡某某做好风险把控

新京报 浏览 11694

张艺谋新片《狙击手》定档7月30日,网友直呼拍片子的速度很快

趣看热点 浏览 23816

难啊!圣诞节以来勇士战绩仅为2胜6负 其中包括连续7个主场

直播吧 浏览 8793

李想向“黑暗”宣战,能挽救MEGA吗?

雷达财经 浏览 7329

普京:国家想发展 每家至少生三个孩子

红星新闻 浏览 58602

腾讯与西湖大学共同申请问答模型专利,可使问答语句更准确连贯

界面新闻 浏览 11312

全国人大“授权”两年多来,浦东新区法规体现出哪些特质?

上观新闻 浏览 10795

乌军趁乱反攻无果 原因是俄军密集布置的地雷阵

枢密院十号 浏览 11880

瓜迪奥拉:给我25天备战德布劳内不会受伤 出战前他说他感觉良好

直播吧 浏览 10409

杨紫琼带小金人为父扫墓 手持香烛鞠躬显虔诚

网易娱乐 浏览 15808

5月新建商品住宅销售价格环比整体涨幅回落 二手住宅环比下降

国家统计局 浏览 12457

周星驰周杰伦合作?经纪人:相关事宜正在沟通中

网易娱乐 浏览 15513

胡塞武装官员回应遭美英空袭:会惩罚他们

环球网 浏览 8517

太狠了!56岁马德钟生日餐惊呆网友,难怪保养得比他儿子还年轻

娱乐白名单 浏览 6704

中国如何应对马斯克星链的4.2万颗卫星?业内解读

DeepTech深科技 浏览 22911

双门短轴丰田70系列,经典硬核越野SUV | 酷乐汽车

CLauto酷乐汽车 浏览 8697
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1