科研成果

资源 1

当前位置: 首页 > 科学研究 > 科研成果 > 正文

弭元元课题组在NeurIPS 2025联合发表论文“揭示大脑如何通过渐进式学习构建知识骨架:一个吸引子动力学视角”

日期:2025-12-04

浏览次数:

图式是大脑对相似经验进行“提炼与打包”后,形成的抽象知识骨架,使我们能够在复杂世界中迅速判断、灵活应对。例如,当你走进一家陌生的餐厅,大脑并不会重新学习“餐厅”这一概念,而是立刻激活与之相关的整套图式 - 入座、点菜、用餐、结账。正是这种可复用、可泛化的结构,让我们得以快速适应新情境。图式犹如大脑理解外部世界的脚手架,为新经验提供承载的结构。

那么,大脑如何有效地学习和建立图式结构?对于简单任务,试错学习或许足以;但在复杂任务中,盲目试探往往代价高昂、效率低下。一种更高效的学习方式是行为塑造(shaping),即将复杂的学习任务拆解为一系列简单的子任务,通过逐步强化正确的中间步骤,引导学习者循序渐进地迈向目标,如图1a所示。尽管行为塑造早已广泛应用于动物复杂行为训练,其如何帮助大脑高效构建可泛化的知识骨架(图式),背后的神经动力学表征与学习机制仍不清楚。

清华大学心理与认知科学系弭元元副教授团队在NeurIPS 2025上发表的最新研究中,基于互馈神经网络,从吸引子动力学视角提出一套可能的机制:塑造训练让网络首先形成基本吸引子,随后将它们连成结构化的序列吸引子,最终通过跨任务的抽象与压缩,沉淀为更高层级的图式吸引子结构征[1]。模型结果与动物在图式演化实验中的观测高度吻合[2]

图 1 (a) 一个动物行为塑造例子;(b)行为塑造形成图式的吸引子动力学猜想;(c-e) 老鼠学习复杂气味序列任务的行为塑造过程。

1. 塑造学习的神经动力学机制猜想

借鉴动物实验中的行为塑造范式[2],我们提出图式形成的三阶段动力学学习猜想,如图1bc所示。

(1)基本任务学习 (Task Primitive Learning): 神经系统首先掌握单个子任务,其动力学对应于形成相对稳定的基本吸引子,如离散吸引子。

(2)序列任务学习 (Task Sequence Learning): 多个子任务被整合成有序流程,离散吸引子之间建立过渡关系,构成序列吸引子轨迹。

(3)图式任务学习 (Task Schema Learning): 大脑在学习不同但结构相似的序列任务时,会对其吸引子轨迹进行压缩,过滤掉个别任务的特异细节,只保留共享的时序规律,最终形成抽象的图式吸引子。

2. 模型架构和实验现象解释

图 2(a)模型结构示意图;(b) 模型在图式任务学习阶段展现“学会学习”行为;(c-d) 模型形成类似老鼠OFC的结构化的任务几何表征;(e-f) 模型展现类似老鼠OFC的维度压缩现象。

为了验证猜想,我们构建了一个互馈神经网络 (2a),按照与动物训练一致的塑造流程进行三阶段学习,旨在通过先易后难的递进方式形成图式,如图 1c-e 所示:(1)基本任务学习:学习气味-奖励关联;(2)序列任务学习: 模型将气味-奖励关联编织成结构化序列;(3)图式任务学习: 模型在跨问题学习中提取结构规律。

模型成功复现了老鼠眶额叶皮层(OFC)在气味序列任务中观察到的核心现象,涵盖行为、神经表征和学习动力学演化三个层面。(1)学习加速:模型展现“学会学习”行为(图2b);(2)几何结构相似:模型隐藏状态呈现类似OFC的分层结构化表征(图2cd);(3)维度压缩:模型表征空间逐渐低秩,与OFC一致(图2ef)。这说明塑造训练能引导网络提炼出跨问题共享的结构性规律,而不仅仅记住任务细节。

3. 图式学习的吸引子动力学过程:三阶段演化机制

图 3(a-c)基本任务学习时,网络形成基本的离散吸引子结构;(d-f)序列任务学习时,网络将离散吸引子连接为序列吸引子;(g-i)图式任务学习时,网络中具有相似气味奖励结构的吸引子序列(S1a、S1b和S2a)被压缩抽象为一条共享的吸引子轨迹。

模型动力学可视化揭示了图式形成的连续演化过程,与提出的猜想一致。(1)离散吸引子的出现(图3a-c);(2)吸引子之间的连接,形成序列轨迹(图3d-f);(3)不同序列吸引子的压缩合并,形成共享轨迹(图3g-i)。最终,不同问题的相似结构在吸引子空间中被“叠合和抽象”为一条共享轨迹,即图式。

4. 有塑造和无塑造网络的学习演化路径差异

图 4 无塑造网络在学习早期就陷入过于低秩的表征空间,体现为关键的吸引子序列S2a/S2b的P4-P5共享一条吸引子轨迹。

为什么塑造训练如此关键?实验表明,有塑造网络在学习效率和泛化上明显优于无塑造(Unshaped)网络。对比分析显示,(1)无塑造网络在训练早期即过度压缩,陷入低维表征,导致不同序列吸引子混叠(图4);(2)有塑造网络通过分阶段学习搭建动力学脚手架,使压缩过程有序进行,从而获得更稳健的序列结构和更强的泛化能力。即塑造训练从根本上改变了互馈网络吸引子动力学的习得和组织方式。

5. 总结

我们进一步将塑造范式应用于真实世界的关键词识别任务,三阶段训练显著提高了模型学习效率。整体而言,本文提出了一个吸引子动力学框架,解释大脑如何通过行为塑造逐步建立抽象而可泛化的图式结构:从离散吸引子 → 序列吸引子 → 抽象吸引子。这不仅为理解动物与人类的抽象学习机制提供了新动机学视角,也为构建更高效、更可解释的智能学习系统打开了新的可能。

本研究第一作者为重庆大学硕士研究生初治坤,通讯作者为邹晓龙副研究员与我系教师弭元元副教授。清华大学洪波教授对研究作出了重要贡献。本研究获以下项目资助:科技创新2030重大专项(项目号:2021ZD0203705)、国家自然科学基金(62336007)。

论文链接:

https://openreview.net/forum?id=RZp2YKtg4q

参考文献:

[1]Chu, Z., Hong, B., Zou, X., & Mi, Y. (2024). Shaping Sequence Attractor Schema in Recurrent Neural Networks. Advances in Neural Information Processing Systems.

[2]Zhou, J., Jia, C., Montesinos-Cartagena, M., Gardner, M. P., Zong, W., & Schoenbaum, G. (2021). Evolving schema representations in orbitofrontal ensembles during learning. Nature, 590(7847), 606-611.

[3]Zou, XL., Chu, Z., Guo, Q., Cheng, J., Ho, B., Wu, S., & Mi, Y. (2023). Learning and processing the ordinal information of temporal sequences in recurrent neural circuits. Advances in Neural Information Processing Systems, 36, 33999-34020.


教师简介

弭元元

心理与认知科学系副教授、博士生导师

研究方向:计算神经科学

关闭

Copyright © 2002 - 2025 清华大学心理与认知科学系