摘要:简要介绍了Schultz等人的多巴胺收益预测误差假说,反驳Redgrave等人的新异刺激编码假说,在前者的基础上进一步提出多重收益编码\解码假说,用以解释为何新异刺激会引起phasic多巴胺的释放。
目录:
1、背景介绍
-1.1 什么是强化学习
-1.2 中脑多巴胺的特征及通路
2、多巴胺的功能
-2.1、收益预测误差的编码?(Schultz,1998)
-2.2、新异刺激的编码?(Redgrave,1999)
3、奖赏信号的多重收益编码\解码假说——不同的功能系统需要不同的收益编码。
-3.1 为什么需要多重收益编码\解码系统
-注意系统奖赏的独特性
-目标驱动的行为,其奖赏的独特性
-觉醒(arousal)引起的单一收益信号神经网络的计算误差
-3.2 多重收益编码系统的证据:Lateral Habenula 侧缰核与负性奖赏编码
-3.3 多重收益编码\解码模型
目录:
1、背景介绍
-1.1 什么是强化学习
-1.2 中脑多巴胺的特征及通路
2、多巴胺的功能
-2.1、收益预测误差的编码?(Schultz,1998)
-2.2、新异刺激的编码?(Redgrave,1999)
3、奖赏信号的多重收益编码\解码假说——不同的功能系统需要不同的收益编码。
-3.1 为什么需要多重收益编码\解码系统
-注意系统奖赏的独特性
-目标驱动的行为,其奖赏的独特性
-觉醒(arousal)引起的单一收益信号神经网络的计算误差
-3.2 多重收益编码系统的证据:Lateral Habenula 侧缰核与负性奖赏编码
-3.3 多重收益编码\解码模型