教育装备采购网
第七届图书馆 体育培训

发了疯地学习(下篇) ——底层探究,激发学习的元动力

教育装备采购网 2021-05-28 13:19 围观789次

  强化学习,反馈回路与反馈强化就是构成人工智能理论中强化学习的基础机制,强化是指在不断尝试中,个体所学习到的反馈回路,不断更新,并终优化到可能目标的过程,它和监督式机器学习一样,是构成人工智能的基石,从生物学的角度讲,强化学习更符合人类的进化方式,从古代的尼安德特人开始,不符合正反馈回路的行为或族群就注定被环境所更新,也意味着淘汰,人类之所以进化成人类,是因为除了总结旧有知识并发现规律外,还会不断尝试和探索。深度了解强化学习的机制我们就能发现“学习”这个动作的本质。

发了疯地学习(下篇) ——底层探究,激发学习的元动力

  学习,究竟是为了什么?不打游戏是为了更好的学习,更好的学习是为了更好的生活,那什么又是更好的生活呢?可以痛快的玩游戏,算不算更好的生活呢。我们从小被教导要好好学习,却从来没有真正思考过,为什么要好好学习,如果连成因机制都不了解,看再多的思维教学和学习导论,也没有办法让自己高效的执行学习这件事,我们真的厌恶学习吗?

  其实,站在人工智能的角度看,学习和玩游戏没有本质的区别,学习是一个枯燥的过程,你要背单词,记公式,还要练习,玩游戏也是如此,你要记忆每个角色的技能,走位技巧,出装顺序,也要通过很多的对局来练习。在强化学习系统中,他们都是一种东西,即“动作”。动作本身无所谓枯燥和有趣,关键看它所处的状态和预期的奖励。人类厌恶枯燥的东西,所以当学习索然无味时,我们就会讨厌学习,这是天性,学习并不能带来和游戏一样的快感,否则的话,没有人会讨厌学习,但是,也有人却坚持学习并乐在其中,为什么?答案就是反馈机制,当学习的动作带给人的收益为正,就会带给我们所说的快感预期,也即前文所题的多巴胺,如果只靠意志力去学习,就像不断绷紧一根弦,强行违背生理的感觉,到最后早晚会断掉。

发了疯地学习(下篇) ——底层探究,激发学习的元动力

  我们绝大多数人,没有移山填海的毅力,因此这样的学习是不科学的,大脑发出指令的动机其实和海洋馆里的海豹一样,是为了眼前那条小鱼干,顶一次球给一条鱼,只有不断收到正向的反馈,才会自然而然地保持前进的动力。高清楚了这点,我们就可以思考,如何让自己像打游戏一样沉迷于学习。

  我们该怎么做?学霸和学渣的区别,就在于对快感预期的不同,预期不同形成的反馈也不同。学霸,可以看作一个高效的强化学习系统,它具备完整的反馈回路以及有效的反馈强化。具体到操作中,成为学霸,以下三点是基础。

  1, 缩短反馈周期。反馈周期长意味着半衰期长。那半衰期是什么,以后的文章我会讲,这里只需要知道,反馈周期太长,是大多数人无法坚持的主要原因。举个例子,有的人高中学习成绩很好,可是到了大学就一落千丈,有人说是因为高考之后人松懈了,容易变笨犯懒。很可惜,这个说法并没有研究结论支撑,真正的原因是反馈周期的拉长。在高中时,一个月会有三四次测试,努力学习一个周,就能看到努力的效果,班级名次很容易进步,接着,同学吃惊,家长表扬,老师夸赞,你会觉得很开心,打了鸡血一样继续学习,这种感觉可能会持续几天,还没等它消退,下一次考试又来了,在这样的反馈回路中动作带来的奖励被极大加速,整个系统变得完全正向。而上了大学以后,认真学习一个学期才能有一个号的GPA,这个反馈周期变长了好几倍,而且也很少有人再收到过度的夸奖和极大表扬。因此,大多数人坚持不下来,取而代之的很多人习惯,考试前一周开始执行学习的动作,因为只需要一周就可以获得奖励,比如及格。所以,要想办法减少你的反馈周期。其他做法,将大目标分解成小目标,会更容易塑造一个连续的回路。

  2, 增加反馈强化。前面我们提到过三种反馈模式,固定比率强化,固定时距强化,不固定比率强化,那么把游戏替换成学习,我们需要做什么?可以是考试累积进步10名,就请自己吃烧烤;也可以是隔壁班的小爱刮目相看的SSR;又或是再看三小时书就去打游戏。对应到相应的收益上来,就是提高学习留存率;延长学习时间;增加学习收益。

  3, 调整反馈难度,有研究表明,游戏玩家在大多高难度关卡挑战成功后,大脑多巴胺回路会异常激活,也就是说,适当的高难度游戏,能够最大化的激化反馈回路,这也是很多游戏中设置排位赛机制的由来,通过匹配不同难度的对手,既不会让你一直输下去,也不会让你永远赢。而是塑造一种升段掉段的奖励机制,让你的反馈回路一直处于半激活状态。在学习中,如何设置难度,需要根据个人情况制定,下一次考试提高10分,或成为班级第一,就是两种不同的难度,既不要太简单也不要太难。

发了疯地学习(下篇) ——底层探究,激发学习的元动力

  一旦大脑完成了一次正反馈回路,那么久尝试过一次甜头,你的动力就会越来越足,甚至会享受学习这件事本身像打游戏一样,疯狂的学习,这,就是学霸的诞生规则。关于反馈机制,还有很多东西可以讲,具体的学习方法也远不止这些。那MR智慧教育,就是在探究学习动机和反馈的根源后,高效地辅助教学,引导反馈回路的正向,通过形象生动性增加反馈强化,大数据的指导下,也针对性的调整反馈难度。奥图码MR智慧教育,用底层思维逻辑,运用5G/VR/AR/MR/AI等技术手段,激发学习元动力。

  更多精彩,敬请期待。

  奥图码数码科技(上海)有限公司致力于智慧教育驱动力协作发展,欢迎合作垂询。

来源:奥图码数码科技(上海)有限公司 作者:奥图码数码科技(上海)有限公司 责任编辑:逯红栋 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

校体购产品