2020-03-25 09:48:22 brainnews

对他人的刺激和行为的价值进行学习称之为社会（社交）学习

，社会学习有助于提高个体生存率，对文化演化至关重要。该综述对不同物种之间，针对厌恶和喜好的不同情绪效价的社交学习和其中的神经细算系统进行了回顾。

社会学习通常基于自身经验、价值学习、误差预测计算，在跨脑区的神经环路以及处理社交信息的不同脑区中实现。文章对社会学习相关的神经学和计算学观点与对各种复杂行为的理解相结合，从最基本的回避危险行为到复杂的社会学习策略。

在过去几十年中，学习理论，认知科学和人工智能的想法都聚集在一个统一的框架，那就是强化学习。其目的是来学习如何回报最大化，并尽量减少惩罚。基于该理论提出的Rescorla–Wagner学习法则，强调了预测误差的概念，即对先天刺激的经验值与可区分的线索的期望值的差值，强化学习则是一直更新并缩小该差值。

日后许多工作都将涉及到神经和计算估值系统，包含决策的学习分成两类，分别是巴普洛夫式经典条件反射学习系统与操作式条件反射学习系统。二者具有相似的预测和纠错系统，但学习预测与行为的关系不尽相同。接下来，文章将针对两个学习系统进行细致的讨论。

在讨论社会相关学习之前，我们需要先关注一下非社会式的通过直接经验的学习，即直接感知环境中危险或者奖赏。我们进而可以分为直接式巴普洛夫学习和直接式操作式学习。

在巴普洛夫式危险学习中，在啮齿类动物模型试验中发现前额皮层、海马(HPC)、杏仁核、中脑等多脑区对巴普洛夫式危险学习的不同阶段有响应。在基于人的临床实验中，显示杏仁核、海马、前额皮层的广泛连接，岛叶皮层、扣带皮层（ACC）、杏仁核的相互连接都对巴普洛夫式危险学习有响应。而在巴普洛夫式奖励学习中，VTA-NAcc环路，杏仁核/海马/前额皮层-NAcc环路，包括眶额叶皮层作用于奖励信息或奖励线索等行为中。

对于直接操作式学习，其本质是学习新行为来避免危险或得到奖励，利用个人经验评估行为和结果之间的关系来避免危险或者获得食物和安全。BLA/HPC/PFC三个不同的脑区分别对纹状体的投射对操作式行为中价值的编码起到不同的作用。而多巴胺皮质纹状体环路对于奖励相关的强化学习中误差预测至关重要。

接下来文章着重讨论社会学习，同样，我们可以分为巴普洛夫式社会学习和操作式社会学习。

对于巴普洛夫式社会学习，ACC-BLA, ACC-HPC环路编码社会危险学习；而在社会奖励学习中，NAcc、VTA 和杏仁核于直接经验式巴普洛夫奖励学习一样，共用同一套正负价值编码系统。

对于操作式社会学习中的危险学习，该行为的优势是使个体学习成本降低，从其他个体的危险学习中得到经验，避免自身的危险因素，增强了回避反应的社交式学习能力。其中，内侧前额皮层（mPFC）在操作式的社会危险学习中起到重要作用；对于社交式操作奖励学习，mPFC、腹侧纹状体、NAcc都参与其中。纹状体、扣带皮层有可能参与到对误差信号的预测中。

可以看出，无论是直接经验还是间接式社会经验，巴普洛夫式学习抑或是操作式学习，在很大程度上共用一套神经环路系统，但在细微的功能上存在差别。

在未来的研究中，将计算系统的社会学习功能与基础神经网络进行结合，利用更多的动物模型探究社交行为的细胞分子机制，底层神经环路基础。

联系小编，留言：思维导图，获取高清版导图

参考文献：

Olsson, A., Knapska, E. & Lindström, B. The neural and computational systems of social learning. Nat. Rev. Neurosci. 1–16 (2020) doi:10.1038/s41583-020-0276-4.