部分强化
有机体做出的正确反应中只有部分得到强化的训练
部分强化(partial reinforcement),又称间断强化,是操作条件反射中的强化程式之一,与连续强化相对,指在有机体的正确反应中仅有部分反应得到强化的训练方式。其类型包括定比率强化定时距强化变比率强化变时距强化,无需对每个正确反应给予非条件刺激。该程式形成的操作条件作用所需时间较长,但形成后消退抗性更强。部分强化在行为训练中具有实际应用价值,例如按固定时距可模拟每月发放薪水的模式,按变比率则适用于完成特定数量任务后获得奖励的场景。其分类框架包含四种基本类型,能够通过调整强化间隔或频率影响有机体的反应速度,常作为评估行为变化的指标。
定义
部分强化(partial reinforcement) 亦称间断强化(intermittent reinforcement),与“连续强化”相对,是强化程式的一种。指有机体做出的正确反应中只有部分得到强化的训练。
类型
间断强化有4种分类,分别为定比率强化、定时距强化、变比率强化和变时距强化。
定比率强化(fixed-ratio reinforcement),操作条件反射强化方式之一,与“变比率强化”相对。指有机体得到两次强化之间的正确反应次数固定的训练方式。要求按照时间比率对有机体给予强化,比率的大小固定。
定时距强化(fixed-interval reinforcement),操作条件反射强化方式之一,与“变时距强化”相对。指有机体得到两次强化之间的时间间隔固定的训练方式。
变比率强化(variable-ratio reinforcement),操作条件反射强化方式之一,与“定比率强化”相对。指有机体得到两次强化之间的正确反应次数不定的训练方式。要求按时间比率对有机体予以强化,但比率的大小固定不变。即当有机体做出与轨道的平均数接近的正确反应时,给予一次强化。
变时距强化(variable-interval reinforcement),操作条件反射强化方式之一,与“定时距强化”相对。指有机体得到两次强化之间的时间间隔不定的训练方式。要求不按固定的时距对有机体的正确反应给予强化,当有机体在接近规定的平均时距内作出反应时,给予强化;不足或超过平均时距作出反应,则不予强化。
与连续强化的对比
部分强化与连续强化不同,不必对每个反应都给予非条件刺激。间断强化条件下,操作条件作用需要的时间要比连续强化多得多,学习一旦形成也较难消退。
参考资料
最新修订时间:2025-10-07 06:22
目录
概述
定义
类型
参考资料