教育装备采购网
第七届图书馆 体育教师课题研修班

天津大学首创深度强化学习方法检测模型缺陷

教育装备采购网 2018-05-11 08:48 围观505次

  摘要:日前,天津大学软件学院多智能体与深度强化学习研究团队在与东京大学、日本 AIST 研究所合作研究基础上,首次利用深度强化学习方法来检测信息物理系统模型中的缺陷……

  随着第一个战胜围棋世界冠军的人工智能程序——阿尔法狗的出现,深度强化学习的浪潮在世界范围内掀起,国内外众多科研机构和高校科研团队纷纷投入其中。深度强化学习方法在游戏、智能机器人控制等领域取得了不错的成效,如星际争霸游戏研发、机器人Atlas等。

  与此同时,承载着物联网、智能家居、机器人、智能导航等新一代智能科技的多维复杂系统——信息物理系统,也逐渐走进人们生活,应用也越来越广泛,但系统的缺陷检测一直存在问题。如何更高效更准确地检测出系统缺陷,从而保障系统的稳定性和安全性成为研究人员关注的焦点。

  通过数年的深入研究,天津大学的研究人员首次将深度强化学习方法应用于信息物理系统的缺陷检测,大大提高了系统检测的成功率,检测效率也得到明显提升。

  传统的缺陷检测方法是以鲁棒性(系统稳定性)为导向,采取随机全局优化的算法,来达到最大化鲁棒性的目的。传统方法必须要将整个模拟实验完整执行一遍后才能给出反馈,因此在缺陷检测过程中需要大量反复的模拟运行,时间久且无法保证检测效果。

  而基于强化学习的信息物理系统模型性质的缺陷检测方法,采用了当下国际上最先进的强化学习技术A3C和DDQN,来解决信息物理系统模型违反鲁棒性性质的问题。该技术可以观察环境反馈,进行自我优化,及时调整输入行为,以更少次的模拟实验找出系统缺陷。

来源:北方网 作者:段玮 赵习钧 责任编辑:寿淑衡 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

校体购产品