教育装备采购网
河南大学体育论坛580*60 第六届图书馆论坛580*60

R语言数据挖掘、机器学习、网络爬虫、文本分析案例实战

教育装备采购网 2017-07-05 09:11 围观1238次

  会议主题

  R语言数据挖掘、机器学习、网络爬虫、文本分析案例实战

  时间地点

  2017年7月22日--7月23日 北京理工大学(具体教室会另行通知)

  (时间安排:外地参会人员21日报到,22日~23日正式会议,24日答疑,学员可针对自身情况选择参加 )

  主办机构

  主办方:雪晴数据网

  协办方:北京理工大学大数据创新学习中心、北京友万信息科技有限公司、爬虫俱乐部

  培训目标

  本次研讨会采取深入浅出的方法,先以简单的案例引入R数据分析的基本原理,随后重点讲解多种常用单元的功能和特性,以及有R数据分析与数据的实用技术和处理方法,结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升与会者解决复杂问题的能力。学完课程之后,学员可以用R作为工具独立完成数据挖掘的整个流程。

  培训特点

  我们以全流程的完整案例讲解利用R完成数据整理、探索性数据分析、建模分析、模型评估、报告展示等环节。

  我们将R语言的应用与业务实际相结合,而不是通篇介绍R包和函数。

  我们还有动手实践环节,有老师和助教解答学员在操作中遇到的问题。

  还将针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升学员解决复杂问题的能力。

  学习结束后,学员可得到本次课程的全程视频,以便进一步学习。

  为什么要学R语言,学了以后有什么好处?

  不论您是在互联网行业,还是在银行,抑或是在高校里做教学科研的工作,有可能会接触到数据处理、数据建模的问题。有可能在你组织机构内部的数据不够,你需要从网上爬取更多的数据。在将你的业务问题转化为数据分析的问题之后,就需要使用工具来帮你做数据处理和建模的工作。相对于SPSS来说,R更加灵活,包含有从数据获取、数据整理、建模、可视化展示、自动化报告等完整的分析流程所需要的功能。相对于C++、Java这些通用编程语言来说,R是专门为数据分析的任务设计的,语法更简洁,学习成本更低,功能更强大。根据我们多年的经验,非计算机专业的人学习R语言,会更快上手。

  网上有很多R语言的课程,为什么要选雪晴数据网?

  市场上有各种R语言的课程,各有各的特色及优点,有的还是免费的,这里我们不比较各自的不同,就说说我们有什么优点吧:

  优秀的讲师团队:我们的讲师不但有多年的工作经验,也有丰富的教学经验,不但技术过硬,也善于用通俗的语言讲解复杂的知识点,更有耐心为学员解答学习过程中的问题。每次课程我们都会反复研究,花大量时间准备课程材料,力求用最适合的案例和方式为学员讲解。

  案例教学的方法:我们从2013年开始举办公开的技术培训,也曾多次给企业做内部培训,从多年的教学实践中,我们发现,用传统以知识点讲解为主线,案例为辅的方式,效果并不好。学员反映,听了后面忘前面,学了一堆东西却不知道怎么用。经过多次尝试,我们摒弃了这种教学方式,采用以案例为主线,在案例中讲解知识点的方法,在一个案例中串联多个知识点,利用遗忘曲线的原理,我们用多个案例重现数据分析的流程,学员自然会举一反三了。

  选取有实用价值的案例:iris数据集、titanic数据、NBA比赛数据跟我们的工作和科研有什么关系?基本没关系,那我们在讲课的时候就不会用这种数据。而且我们教的是如何使用数据分析技术,并不是教你怎么写代码,我们培养的不是码农,而是数据科学家。所以我们选择的案例,都是有现实的商业意义,或者科研价值。在讲解过程中,不但告诉你代码怎么写,还会教你怎么解决问题,为什么要这么做。

  贴心的助教制度:我们每次开课都会有助教,因为是手把手的课程,助教的存在,就是为了能解答您的问题,确保您有学会,满载回家。而且我们的助教都有实战经验,有的来自业界,有的可能就是前几批的优秀学员,我们也欢迎您以后加入我们的助教或讲师团队。

  对课程品质的坚持:我们在不同场合讲解过课程的内容,不断调整打磨课程,即使是相近的主题,我们也会对课程内容和案例进行升级,挑选出最适合市场趋势的案例和技术来讲解。

  报名参加培训之后,还能得到什么福利?

  · 报名参加我们的课程,就自动成为我们的VIP会员,以后购买我们的线下或线上课程都有优惠。

  · 加入到我们的VIP微信群、QQ群中,以后在学习中如果遇到问题,我们的老师和助教会帮忙解答

  · 一些不方便大范围分享的演讲视频和课程视频,我们会优先分享给VIP会员。比如,本次课程之后,学员将获赠《R语言可重复研究与自动化报告》、《R语言时间序列分析》这两门视频课程

  · 我们组织的内部分享会,VIP会员有优先报名权

  没有学过R,也可以来上课吗?

  当然可以。其实每次都有对编程一无所知的小白来参加我们的课程,他们甚至对电脑的很多知识都不甚了解,经过两三天的课程,不少人不但跟下来了,还很有收获。对R有一点认识的朋友相信一定可以得心应手,针对完全没有碰过R的新手,报名之后我们会推荐您R的基础在线课程进行课前的练习,也可以提前一天报到,参加我们的课前辅导。

  另外,即使没有完全学会编程的内容,听听老师讲的案例和数据分析的思想也是很有收获的。

  培训对象

  从事互联网、金融、医疗、生态、经济、统计、银行、通信、环境行业的数据分析从业人员,以及相关企事业单位技术骨干、科研院所研究人员,和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员。

  讲师介绍

  陈堰平,雪晴数据网创始人,北京理工大学大数据创新学习中心导师团成员,2017年1月获“微软最有价值专家”荣誉称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为国家统计局、微软、惠普、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通、国家检察官学院等机构做过数据科学方面的培训和咨询。曾开发贝叶斯动态预测模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲的在线公开课《R语言数据分析入门》、《R语言大规模数据分析实战》已在多个平台上发布,累积学习人数过万人。

  培训费用

  在职人员2000元/人,学生1600元/人(含会议注册费、资料费、场地费)。食宿费用自理。

  与会者可申请工信部《数据挖掘与分析应用高级工程师》职业技术水平证书,通过考核后即可获得证书,需另交考试费、证书工本费共400元。

  参与雪晴数据网奖学金计划,更可以减免大笔学费,只要你足够勤奋,可以免费学!!

  奖学金计划

  1. 为雪晴数据网(www.xueqing.tv)投稿的用户(原创或翻译文章),可以获得代金券(按文章质量,奖励50到200元不等),以抵扣线上线下课程学费,投稿请联系管理员contact@xueqing.tv

  2. 注册并登录雪晴数据网,进入用户中心,然后进入邀请页面(http://www.xueqing.tv/me/invite ),获得邀请链接后,转发给好友,如果对方成功注册,双方都可获得奖励,可抵扣学费。

  3. 累计五天(可不连续)转发本课程通知到自己朋友圈,并附上推荐理由,截图发给我们的工作人员,报名可优惠200元。

  优惠政策

  1. 现场班老学员8折优惠

  2. 三人以上同时报名9折优惠

  3. 五人以上同时报名8折优惠

  课程安排

  本次讨论会采取“线上+线下”的方式,雪晴数据网已经上线了数门在线课程,免费向公众开放,我们会在课程里介绍R语言的基础知识。参加线下课程的学员,除了可以学习线上免费课程,还可以在线下学习更加深入的行业案例,并在课后得到线下课程的视频。

  线上课程

  · R语言的介绍及基础语法:如何学习R,R的数据结构,控制语句等

  · 读写数据:从文件、网络、数据库等数据源读取数据,保存数据到文件、数据库

  · 数据整理入门:数据的变换、重塑、拆分合并以及汇总

  · 数据可视化:基础绘图系统、lattice、ggplot2等介绍

  请于线下课程开始之前自己学习以下课程

  · http://www.xueqing.tv/course/1

  · http://www.xueqing.tv/course/64

  · http://www.xueqing.tv/course/31

  · http://www.xueqing.tv/course/66

  · http://www.xueqing.tv/course/67

  · http://www.xueqing.tv/course/69

  线下课程

  时间: 2017年7月22日(周六)~23日(周日)

  地点:北京理工大学

  课程大纲

第一天
第一讲
R语言介绍及R语言基础语法
1. 什么是R 及如何学习R
2. Rstudio,扩展包,工作空间
3. 数据对象
4. 向量化操作
5. 函数和控制语句
6. R命令提示符及R 脚本文件
涉及知识点:
dplyr包:数据整理、筛选、汇总
ggplot2:数据可视化
探索性数据分析:交叉表
预测性分析:利用指数平滑等方法预测销售量
knitr包:自动化报表 flexdashboard包:仪表盘
网络爬虫
文本分析

案例一: 针对一份电子商务网站的订单数据,从产品、客户、地区等维度来分析销售额和利润,也可以时间的维度纵向分析销售趋势。

案例二: 抓取中国政府网历年政府工作报告,并做文本分析
第二讲
数据整理与数据可视化
1. 数据变换、重塑及拆分合并
2. 汇总数据、字符串操作、日期操作
3. R 语言中的可视化函数
4. 单变量的特征 、比例的构成
5. 多变量的关系、展现时间的变化
第三讲
用R做可重复研究和自动化仪表盘
1. 如何用R在重复研究中自动生成分析报告
2. 可视化展示:并用shiny包创建基于Web的动态仪表盘,实现各地区销售额动态比较图
3. 用knitr编写自动化报告
第四讲
网络爬虫与文本分析
1. 利用rvest包爬取页面
2. 分词、词频分析、词云等文本分析
第二天
第五讲
初等统计方法及线性回归模型
1. 简单线性回归
2. 回归诊断
3. 多元回归
4. 主成分分析等等
涉及知识点:
glm、glmnet、rpart、xgboost等函数和包的使用
因子变量的处理
共线性的识别和处理
Logistic回归模型系数的商业理解
Microsoft R Server的介绍

案例三: 某连锁餐厅为提高营业额,做了一次市场调查,根据收集到的数据,分析是哪些因素影响营业额,并提出改善经营的建议

案例四: 预测贷款逾期者(银行业) -- 某银行希望根据客户过去的贷款数据来建模,以便用模型来预测新的贷款者,核贷后会逾期的机率,以做为银行是否核贷的依据,或提供给客户其他类型的贷款产品。

案例五: 零售业销售促销(零售业):此案例的目的是想根据零售产品过去的促销记录,利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。
第六讲
Logistic回归及多分类Logistic模型
1. logistic回归原理
2. 实现原理及输出解释
3. 无序多分类的logistic回归模型
第七讲
数据挖掘模型
1. 基于树的模型:决策树、随机森林
2. boosting方法:adaboost、XGBoost
3. 神经网络与深度学习
第八讲
利用Microsoft R Server突破内存限制做海量数据挖掘
1. Microsoft R Server 9.1的下载及安装
2. Microsoft R Server中大数据包的介绍
3. 案例演示

  报名方式

  在浏览器访问 http://www.uone-tech.cn/hd-r20170722bj.html,下载报名表并Email至:peixun@uone-tech.cn提交。我们随后会联系您。确认报名后,请通过以下三种支付方式中的一种来缴费(请保留支付凭证,拍照或截图发给我们的工作人员 ):

  方式一: 对公转账

  开户名 绘辰科技(北京)有限公司

  开户银行 中国工商银行股份公司北京大钟寺东路支行

  账号 0200151609100034763

  方式二: 支付宝

  账号 pay@xueqingtv.com

  户名 绘辰科技(北京)有限公司

  方式三: 现场缴费

  外地学员请于21号提前报到,北京学员可于22号早上8点~8点半报到,缴费并领取发票和纸质邀请函,以及上课教材

  由于22号早上现场人比较多,鼓励北京学员也于21号报到

  联系方式

  联系人:陈洁老师

  QQ :529698127 验证信息请填写R培训

  Email: peixun@uone-tech.cn

  手机/微信:136-6072-3699

点击进入北京友万信息科技有限公司展台查看更多 来源:教育装备采购网 作者:北京友万信息科技有限公司 责任编辑:云燕 我要投稿
校体购终极页

相关阅读

版权与免责声明:

① 凡本网注明"来源:教育装备采购网"的所有作品,版权均属于教育装备采购网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:教育装备采购网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:XXX(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为放弃相关权利。

九牧