发了疯地学习（下篇） ——底层探究，激发学习的元动力

教育装备采购网 2021-05-28 13:19 围观859次

　　强化学习，反馈回路与反馈强化就是构成人工智能理论中强化学习的基础机制，强化是指在不断尝试中，个体所学习到的反馈回路，不断更新，并最终优化到可能目标的过程，它和监督式机器学习一样，是构成人工智能的基石，从生物学的角度讲，强化学习更符合人类的进化方式，从古代的尼安德特人开始，不符合正反馈回路的行为或族群就注定被环境所更新，也意味着淘汰，人类之所以进化成人类，是因为除了总结旧有知识并发现规律外，还会不断尝试和探索。深度了解强化学习的机制我们就能发现“学习”这个动作的本质。

　　学习，究竟是为了什么？不打游戏是为了更好的学习，更好的学习是为了更好的生活，那什么又是更好的生活呢？可以痛快的玩游戏，算不算更好的生活呢。我们从小被教导要好好学习，却从来没有真正思考过，为什么要好好学习，如果连成因机制都不了解，看再多的思维教学和学习导论，也没有办法让自己高效的执行学习这件事，我们真的厌恶学习吗？

　　其实，站在人工智能的角度看，学习和玩游戏没有本质的区别，学习是一个枯燥的过程，你要背单词，记公式，还要练习，玩游戏也是如此，你要记忆每个角色的技能，走位技巧，出装顺序，也要通过很多的对局来练习。在强化学习系统中，他们都是一种东西，即“动作”。动作本身无所谓枯燥和有趣，关键看它所处的状态和预期的奖励。人类厌恶枯燥的东西，所以当学习索然无味时，我们就会讨厌学习，这是天性，学习并不能带来和游戏一样的快感，否则的话，没有人会讨厌学习，但是，也有人却坚持学习并乐在其中，为什么？答案就是反馈机制，当学习的动作带给人的收益为正，就会带给我们所说的快感预期，也即前文所题的多巴胺，如果只靠意志力去学习，就像不断绷紧一根弦，强行违背生理的感觉，到最后早晚会断掉。

发了疯地学习（下篇） ——底层探究，激发学习的元动力

　　我们绝大多数人，没有移山填海的毅力，因此这样的学习是不科学的，大脑发出指令的动机其实和海洋馆里的海豹一样，是为了眼前那条小鱼干，顶一次球给一条鱼，只有不断收到正向的反馈，才会自然而然地保持前进的动力。高清楚了这点，我们就可以思考，如何让自己像打游戏一样沉迷于学习。

　　我们该怎么做？学霸和学渣的区别，就在于对快感预期的不同，预期不同形成的反馈也不同。学霸，可以看作一个高效的强化学习系统，它具备完整的反馈回路以及有效的反馈强化。具体到操作中，成为学霸，以下三点是基础。

　　1，缩短反馈周期。反馈周期长意味着半衰期长。那半衰期是什么，以后的文章我会讲，这里只需要知道，反馈周期太长，是大多数人无法坚持的主要原因。举个例子，有的人高中学习成绩很好，可是到了大学就一落千丈，有人说是因为高考之后人松懈了，容易变笨犯懒。很可惜，这个说法并没有研究结论支撑，真正的原因是反馈周期的拉长。在高中时，一个月会有三四次测试，努力学习一个周，就能看到努力的效果，班级名次很容易进步，接着，同学吃惊，家长表扬，老师夸赞，你会觉得很开心，打了鸡血一样继续学习，这种感觉可能会持续几天，还没等它消退，下一次考试又来了，在这样的反馈回路中动作带来的奖励被极大加速，整个系统变得完全正向。而上了大学以后，认真学习一个学期才能有一个号的GPA，这个反馈周期变长了好几倍，而且也很少有人再收到过度的夸奖和极大表扬。因此，大多数人坚持不下来，取而代之的很多人习惯，考试前一周开始执行学习的动作，因为只需要一周就可以获得奖励，比如及格。所以，要想办法减少你的反馈周期。其他做法，将大目标分解成小目标，会更容易塑造一个连续的回路。

　　2，增加反馈强化。前面我们提到过三种反馈模式，固定比率强化，固定时距强化，不固定比率强化，那么把游戏替换成学习，我们需要做什么？可以是考试累积进步10名，就请自己吃烧烤；也可以是隔壁班的小爱刮目相看的SSR；又或是再看三小时书就去打游戏。对应到相应的收益上来，就是提高学习留存率；延长学习时间；增加学习收益。

　　3，调整反馈难度，有研究表明，游戏玩家在大多高难度关卡挑战成功后，大脑多巴胺回路会异常激活，也就是说，适当的高难度游戏，能够最大化的激化反馈回路，这也是很多游戏中设置排位赛机制的由来，通过匹配不同难度的对手，既不会让你一直输下去，也不会让你永远赢。而是塑造一种升段掉段的奖励机制，让你的反馈回路一直处于半激活状态。在学习中，如何设置难度，需要根据个人情况制定，下一次考试提高10分，或成为班级第一，就是两种不同的难度，既不要太简单也不要太难。

发了疯地学习（下篇） ——底层探究，激发学习的元动力

　　一旦大脑完成了一次正反馈回路，那么久尝试过一次甜头，你的动力就会越来越足，甚至会享受学习这件事本身像打游戏一样，疯狂的学习，这，就是学霸的诞生规则。关于反馈机制，还有很多东西可以讲，具体的学习方法也远不止这些。那MR智慧教育，就是在探究学习动机和反馈的根源后，高效地辅助教学，引导反馈回路的正向，通过形象生动性增加反馈强化，大数据的指导下，也针对性的调整反馈难度。奥图码MR智慧教育，用底层思维逻辑，运用5G/VR/AR/MR/AI等技术手段，激发学习元动力。

相关阅读

AI+教育如何“即想即印即批”？爱普生携手生态合作伙伴解锁智慧学习新速度
爱普生06-25
AI正在深刻改变教育模式，智慧课堂、个性化学习方案层出不穷，爱普生携手中国陶行知研究会智慧教育分会、南京功夫豆解锁智慧学习新速度。一方面，通过功夫豆云打印平台实现按需打印、低成本运维...
C-Life数智运动亮相柳州中小学人工智能教育科技年启动会，助力智慧体育发展
搜狐06-04
日前，2026年柳州市中小学人工智能教育科技年活动在柳州市壶西实验中学圆满落幕。本次活动设置AI教育设备展示、AI辅助学科课堂展示、专家讲座、学生科...
智启未来，育见巅峰！2026亚太人工智能教育大会即将福州盛大启幕
搜狐05-18
AI浪潮席卷全球，教育变革正当其时！2026年5月22日-24日，2026亚太人工智能教育大会将在福州重磅召开！这场汇聚全球顶尖智慧、引领AI教育风向的行业盛...
中小学人工智能实验室建设方案及可行性报告
教育装备采购网05-11
一、项目立项依据2017年7月,国务院发布了《新一代人工智能发展规划》,人工智能已上升为战略，在《新一代人工智能发展规划》中明确提出“支持开展形式多...
津发科技入选全国信标委人工智能分委会单位委员
教育装备采购网02-02
经TC28/SC42全国信息技术标准化技术委员会人工智能分技术委员会严格审核和批准，北京津发科技股份有限公司（简称“津发科技”）入选为全国信标委人工智...
【快讯】海豚人工智能实验室 · 成功落地湖北大学人工智能学院！
搜狐12-24
近日，杭州睿数科技的【海豚人工智能实验室】在湖北大学人工智能学院完成平台部署，并通过项目验收，即将正式投入教学使用。该平台将全面支撑学院人工...
北京竞业达亮相第二届城市中小学科学教育协同发展大会
教育装备采购网11-18
AIGC助力中小学人工智能教育创新升级11月14—15日，2025年第二届城市中小学科学教育协同发展大会在天津市南开区成功举办。大会聚焦“区域科教协同”与...
软通华方超炫3700四卡液冷工作站，澎湃算力擘画教育蓝图
网络11-14
当《北京市教育领域人工智能应用工作方案》描绘出以智助教、以智助学、以智助评、以智助育、以智助研、以智助管六大领域的应用场景的蓝图，强大的本地算力基础设施便成为实现这些愿景的坚实底座...

版权与免责声明：

① 凡本网注明"来源：教育装备采购网"的所有作品，版权均属于教育装备采购网，未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品，应在授权范围内使用，并注明"来源：教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源：XXX（非本网）"的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责，且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用，必须保留本网注明的"稿件来源"，并自负版权等法律责任。

③ 如涉及作品内容、版权等问题，请在作品发表之日起两周内与本网联系，否则视为放弃相关权利。