天天看点:AI心理推断能力或与人类相当
发布日期: 2024-05-23 09:50:13 来源: 科技日报
(资料图片)
新一期《自然·人类行为》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,LLM这类人工智能(AI)可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚LLM在心智理论任务(被认为是人类独有的能力)中的表现是否也能比肩人类。
此次,德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。
团队发现,GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。研究人员指出,LLaMA2的成功是因为回答的偏见程度较低,而不是因为真的对失礼敏感;GPT看起来的失利,其实是因为对坚持结论的超保守态度,而不是因为推理错误。
研究团队认为,LLM在心智理论任务上的表现堪比人类,不等于它们具有人类般的“情商”,也不意味着它们能掌握心智理论。但他们也指出,这些结果是未来研究的重要基础,并建议进一步研究LLM在心理推断上的表现,以及这些表现会如何影响人类在人机交互中的认知。
关键词:
推荐内容
- 天天看点:AI心理推断能力或与人类相当 a>
- 关注:国家数据局印发《数字中国建设2024年工作要点清单》 a>
- 轻体魔盒,AI体重管理,助你拥有浪姐何洁般好身材! a>
- 龍龍龍!玲龙一号首堆“大脑”正式启动-全球快播 a>
- 人工智能会导致电力短缺吗 a>
- 条码支付互联互通持续推进,如何更好便利扫码消费? a>
- 四部门制定《互联网政务应用安全管理规定》 a>
- 邓州市腰店镇纪委:“三个聚焦”助推营商环境优化 天天新视野 a>
- 看热讯:新野县王集镇:西瓜丰收“有甜头” 群众致富“有奔头” a>
- 天天快资讯丨西峡法院:抚养费纠纷中的司法柔情 a>
- 西峡农商银行举办火灾警示教育培训和消防应急演练|热讯 a>
- 邓州法院:健康权纠纷巧化解 悉心调解促和谐 a>
- 每日消息!新野县法院:“五心”调解法 成功解心结 a>
- 热门看点:“百城焕新购车节”开启 汽车之家携手平安产险助力汽车产业新质生产力提升 a>
- 低空经济攀高向新 配套产业链式“护航”_焦点讯息 a>
- 驻马店开发区金山办事处翟庄居委会开展“护航‘三夏’ 力创‘五星’”志愿服务活动 全球视讯 a>
- 邓州市裴营乡卫生院:进村入户签约忙 优化居民健康环境 a>
- 驻马店市生态环境局遂平分局开展生物多样性日宣传活动 全球讯息 a>
- 息县县委书记管保臣调研产业发展情况-世界热点评 a>
- 息县:落实“绿色税制” 助力“绿色发展” 天天新资讯 a>