科研成果

资源 1

当前位置: 首页 > 科学研究 > 科研成果 > 正文

清华大学心理与认知科学系张丹课题组在iScience发表基于大语言模型的情绪推断能力机制研究

日期:2024-11-20

浏览次数:

语言除了作为情绪体验的交流工具外,是否也可以用于支持情绪理解与推断?为探究这一问题,清华大学心理与认知科学系张丹课题组联合清华大学计算机科学与技术系刘知远课题组,运用大语言模型(LLM)探讨了从语言经验中习得的情绪知识表征特点,发现从基于语言经验的情绪知识表征到情绪推断能力的因果关联。

图1 研究框架图

这项研究将LLM作为仅有语言经验而缺乏感官-运动经验的模型,研究了语言本身如何表征情绪概念知识。研究发现,人类情绪概念的14个主要属性(基于独立行为实验)被LLM中的不同人工神经元群体所表征。通过操纵这些与情绪概念属性相关的神经元,研究进一步证实了情绪概念知识在生成性情绪推断中的作用:LLM在情绪推断任务中的表现下降程度,与不同属性在人类心理空间中的重要性相关。

图2 研究主要结果。a)LLM中14种人类情绪概念属性特异的神经元分布;b)不同情绪概念属性在人类心理空间中的重要性;c)情绪概念属性在人类心理空间中越重要,操纵其特异神经元后的LLM情绪推断能力越差。

该研究发现为语言在人类情绪理解中的重要作用提供了来自大语言模型视角的关键证据,提示即便是没有任何感官-运动经验的人工智能,也能够在语言的支持下学习并推理情绪。研究为人类情绪的“本质”之争提供了新的视角,为未来如何发展具有社会情感的人工智能提供了有益的启示。

该研究成果已被Cell Press旗下期刊《iScience》正式录用并在线发表。清华大学心理与认知科学系博士生黎明和计算机科学与技术系已毕业博士生苏裕胜为本文共同第一作者,心理与认知科学系张丹副教授和计算机科学与技术系刘知远副教授为本文共同通讯作者。

本研究得到了国家自然科学基金(T2341003, 62236004)、国家重点研发计划(No. 2020AAA0106500)、国家自然科学基金和德国研究基金会跨模态学习项目(NSFC 62061136001/DFG TRR-169/C1, C4)、教育部高等学校心理学类专业教学指导委员会教学改革与研究项目(20222008)和清华大学本科教学改革项目(DX05_02)资助,特此致谢。

论文信息:Li, M.#, Su, Y.#, Huang, H.-Y., Cheng, J., Hu, X., Zhang, X., Wang, H., Qin, Y., Wang, X., Lindquist, K.A., Liu, Z.*, Zhang, D.* (2024). Language-Specific Representation of Emotion-Concept Knowledge Causally Supports Emotion Inference. iScience, 111401.

论文链接:https://www.cell.com/iscience/fulltext/S2589-0042(24)02626-9

关闭

Copyright © 2002 - 2025 清华大学心理与认知科学系