教用户学习——斯金纳箱的入门介绍

4 评论 26644 浏览 22 收藏 9 分钟

斯金纳同学是一名很严肃的心理学家,他摒弃了传统心理学中“心理活动”的不可考也不可靠的分析,将人的内部思维作为黑盒函数,对心理学的外在刺激与外在行为作为自变量和函数结果,进行科学实验分析,这就是“行为心理学”。而“斯金纳箱”,则是他的一项最著名的研究成果。

什么是斯金纳箱?

1.行为与奖励

实验1:将一只很饿的小白鼠放入一个有按钮的箱中,每次按下按钮,则掉落食物。

结果:小白鼠自发学会了按按钮。

这个实验比“给狗狗摇铃喂食”的巴普洛夫实验更进了一步,建立行为。

何为学习?就是指将行为与操作者的需求建立相倚性联系。换句话说,使行为者感觉到“行为”与“奖励”是有联系的。

只要通过将行为与奖励不断重复、建立联系,就可以培养起操作者的行为模式。

奖励可以培养行为习惯,很棒吧?那么看实验2。

2.行为与惩罚

实验2:将一只小白鼠放入一个有按钮的箱中。每次小白鼠不按下按钮,则箱子通电。

结果:小白鼠学会了按按钮。

但遗憾的是,一旦箱子不再通电,小白鼠按按钮的行为迅速消失。

“惩罚”,作为奖励的邪恶双生子,可以迅速建立行为模式。然而,惩罚具有一定的副作用:它建立起来的行为模式,来得快,去得也快。一旦惩罚消失,则行为模式也会迅速消失。

从长远来看,惩罚对于行为的制止并不会起到显著作用。现实生活中,因为惩罚带来的凡勃伦效应,有时甚至会使惩罚起反作用。(凡勃伦效应请参考20140307早读课)

如果想要控制行为者不去进行某个行为时,应找到该错误行为的“奖励物”,移除该奖励,从而制止其错误行为。

然而,即使是奖励,当不再掉落食物时,小白鼠的学习行为也会逐渐消失(虽然消失得稍慢一些)。而且这样太浪费食物了!那该怎么办呢?

接下来是实验3。

3.固定时间奖励

实验3:将一只很饿的小白鼠放入斯金纳箱中,由一开始的一直掉落食物,逐渐降低到每1分钟后,按下按钮可概率掉落食物。

结果:小白鼠一开始不停按钮。过一段时间之后,小白鼠学会了间隔1分钟按一次按钮。

当掉落食物停止时,小白鼠的行为消失。

啧啧,失败了。没有培养起小白鼠连续按按钮的行为,反而使小白鼠“偷懒”了。为什么?因为行为者知道短期内行为不会再得到奖励。……好吧。最关键的实验4。

4.概率型奖励

实验4:将一只很饿的小白鼠放入斯金纳箱中,多次按下按钮,概率掉落食物。

结果:小白鼠学会了不停按钮。

当不再掉落食物时,小白鼠的学习行为消失速度非常慢。

随着概率越来越低,小白鼠按按钮的学习行为没有变化,直至40-60次按按钮掉落一个食物,小白鼠仍然会不停按按钮,持续很久一段时间。

(同样的,用鸽子做实验,平均每5分钟获得变化时距的食物强化的鸽子,每秒能做出2-3次反应,连续反应长达15小时)

这个实验模拟了为什么“赌博”——如简单的老虎机,或者更复杂的赌博——会给予人类以依赖感,或者说,成瘾性。

由于概率性给予结果,行为者很难直观地判断机制是否失效,所以单次的失败不会给予明显的“惩罚”效果,终止行为者的习惯,从而行为者的学习行为会一直持续下去。

然后是一个有趣的实验5。

5.迷信的小白鼠?

实验5:好吧,其实实验5还是实验4,概率型斯金纳箱。

结果:这些小白鼠有很多培养出了奇特的行为习惯,比如撞箱子、比如作揖、比如转圈跳舞。

这是因为掉落食物前,小白鼠正好在进行这些行为,于是产生了“迷信”。

许多游戏中传出的谣言,比如“在中午抽奖容易得到大奖”,或者“带满一背包幸运兔脚可以获得更好的装备”之类,其原理与之相同。

嗯。斯金纳同学的虐鼠实验介绍完毕。

斯金纳箱模式的应用

1、用户行为培养链

设计者需要培养的用户行为可能多种多样,但这些行为尚未被用户接受。如果想要培养出“付出代价”的习惯,就要将“代价”与“需求”之间建立联系。

比如,若游戏玩家追求的是成就感,游戏设计者希望玩家学会“消灭敌人”,那么在“消灭敌人”的时候,必须提供“成就感”的需求,在多次重复的情况下,玩家就会对“消灭敌人”产生认识与学习。

一旦该行为成为了使用者已建立的行为,那么它也可以作为“奖励”去刺激其它行为的培养。这样,多次建立“付费”可以帮助“消灭敌人”的概念,而“消灭敌人”带来“成就感”,游戏对玩家付费行为的培养就可以顺利建立起来。

行为培养需要注意的几点:

1.人类的短期记忆数量为7±2。不要试图同时教给一个人过多的东西。

2.设计行为的重复频率时,别忘了艾宾浩斯遗忘曲线:5分钟,30分钟,12小时,1天,2天,4天,7天,15天。

2、游戏设计

如果你在游戏中见到了这些东西,那么它们往往是斯金纳箱:

1.等级系统。

2.任务系统。

3.成就系统。

4.检查清单。

5.奖励反馈。

没错,几乎包括了游戏中所有东西,在现实生活中也可能会见到一些。它们都有一些固定的特点:1.行为,2.强化刺激,3.不断重复。

事实上,斯金纳试图用他的箱子解释人类的一切学习行为。而他似乎成功了。

3、游戏化

现在的各种运营手段中,有一种叫做“游戏化”的方式,指将一件本来枯燥的现实中的事情变成游戏,比如……麦当劳的儿童套餐收集玩具?信用卡等级积分?老祖母的“如果你期末考前10名,我就带你去游乐场”?嗯嗯。没错。这些都是。

只要强化物得当,强化反复出现,将一件用户付出代价的行为培养成为用户习惯并不困难。

P.S. 最后再介绍一个应用“斯金纳箱”失败的小故事。

实验6:对于两组画画的学生,其中A组在每完成一幅画后给予奖励,B组不给予奖励。

结果:最后得到的结果是A组的作品数量远高于B组,但质量略低于B组。

当停止给予奖励后,A组学生的作品数量和质量均会低于B组。

为什么呢?请各位同学思考一下,在这个实验中,实验者期待的结果是什么?A组被强化的行为到底是什么?B组的行为有没有得到强化呢?

来源:互联网er的早读课  作者:兔

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 受启发了

    来自北京 回复
  2. 有启发

    来自北京 回复
  3. 来自广东 回复