教育装备采购网
第八届图书馆论坛 校体购2

百度AI开放数据集计划走进百所高校

教育装备采购网 2018-02-01 09:36 围观560次

  在2017百度世界大会AI技术与平台论坛上,百度3D视觉首席科学家杨睿刚宣布推出目前全球规模最大的“BROAD”百度AI公开数据集计划(Baidu Research Open-Access Dataset),面向公众开放室外场景理解、视频精彩片段、阅读理解在内的三项数据集。其中针对高校普及、推广这三大数据集,是该计划落地实施的重要一步。

  

  共享海量优质数据 百度AI公开数据集计划寓意深远

  近日,百度正式开始践行这一举措,重点面向海内外高校科研学子推广使用AI数据集。作为“BROAD”计划的重要组成部分,AI数据集走进高校将显著降低机器学习、深度学习的门槛,进一步吸引、挖掘高校环境中潜在的AI开发者,同时为已有的高校开发团队提供数据助力,形成新的行业生态效应。

  当云计算逐步普及减轻了计算能力的成本负担,横亘在科研机构和个人AI开发者面前的最大障碍,是数据数量和质量的缺失。很多高校教师表示,当前,国内特别是高校能接触到的数据非常有限,学生获取数据的方式主要是通过大量阅读国外文献,看到某篇文章引用了某个数据,再查找来源,这种方式非常单一、滞后,对于研究的前瞻性与先进性造成了很大影响。

  作为全球最大的中文搜索引擎,百度在AI领域持续深耕,不仅在数据采集方面拥有得天独厚的优势,而且具备世界前沿的AI技术储备。此次百度着力在高校推广的AI数据集规模巨大、种类丰富,贴近开发场景,可为AI开发中的机器学习提供海量数据支持。

  三大数据集全面开放 计划覆盖百所知名高校

  据悉,此次百度将向高校开放室外场景理解、视频精彩片段、阅读理解三大数据集。室外场景理解数据集来源于百度自动驾驶事业部,其中包括世界上第一个带像素级语义标签的室外3D视频。而首次亮相的百度阅读理解数据集DuReader,则是迄今为止规模最大的中文开放领域阅读理解数据集。对此,已经下载使用过的高校教师表示,相比于之前使用的国外高校实验室与海外企业的数据集,百度此次发布的数据集数据量大、类型丰富,具有先进性,能够满足高校科研、教学的实际需要。

  目前,百度AI数据集已吸引海内外近160所高校关注、下载使用,其中既有清华大学、北京大学、浙江大学、中国科学技术大学等国内重点院校,也包括斯坦福大学、加州大学洛杉矶分校、美麻省理工学院等海外知名学府。通过多层次、有重点的宣传、普及活动,百度BROAD计划将切实落地于自然语言处理、机器学习、计算机视觉等AI新兴热门学科研究,填补高校科研环境中开发数据来源不足的问题。

  百度校企合作层次丰富 助力打造AI研发重地

  如果说数据是个体机器学习时必备的原料,那么人才就是驱动AI全行业发展的助燃剂,高校则是发掘与培养未来AI人才的基地。

  此次百度面向高校推广AI数据集,正是开启了多层次、影响深远的校企合作。开源的数据集有效缓解了当下高校师生的数据缺失难题,师生获取测试数据也更加方便、及时,大大加速了相关领域问题研究的探索进度与先进性;同时对高校日常教学产生深远影响,越来越多的学生能够在日常教学中便能获得实打实的开发训练、在国内外学术界及时发表新的学术研究成果。对于未来的校企合作形式,多所高校教师表示,希望百度能够开放更多领域的AI数据集,并且开源计算接口与基于云计算平台的虚拟设备。

  本次以开源数据集为主题的校企合作,是百度拓展校企合作形式的重要一步。通过更加深层次的资源共享与合作,不仅使得高校更好地借助开放平台完成人工智能的相关研究,推进人工智能相关学科建设,加速人工智能在高校的普及与发展,使高校成为未来人工智能的研发重地;还为人工智能行业提供了富有活力的人才储备,加速推进我国人工智能人才向更高层次发展,以最终实现校企双方在人工智能研发领域的历史性新跨越。

来源:91资讯站 责任编辑:李瑶瑶 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

校体购产品