结盟众多企业“教练”, 共同设计、开发及提供人才培养解决方案,通过新颖多样的学习方式,针对性的定制化内容,助力企业全面提升竞争优势。
Peter彭
2天
5200元/人
数据挖掘和机器学习是属于大数据的核心技术之一,以科学严谨的数据依据帮助企业做分析决策,同时其高深的理论门槛也阻挡了广大工程师的学习上手,在大数据时代,如何进行基于海量数据在成百上千的机器进行分布式数据挖掘更是需要解决的难题,本课程从实战角度出发,基于企业实际需求,深入浅出的讲解数据挖掘最常用的算法和企业场景,让工程师通俗易懂的掌握,并且进行编程落地实践培训,让抽象的算法公式完全落地为工程化的程序为企业所用。详细内容参考课程提纲:
课程面向群体:初中级基础的工程师,数据分析/挖掘/大数据技术人员,企业数据建模/决策人员等等
一、大数据分析挖掘技术介绍
1、map/reduce
2、mahout数据挖掘
3、sql on hadoop
4、spark生态体系
5、R语言
6、MPI并行计算
7、GPU并行计算(深度学习)
8、fourinone并行计算
二、常用机器学习算法原理
1、决策树
2、随机森林
3、协同过滤推荐算法
4、朴素贝叶斯算法
5、k-means聚类算法
6、pagerank算法
7、逻辑回归
三、大数据挖掘业务场景和生产平台
1、互联网金融业务
2、银行客户需求业务
3、大数据分析生产平台
4、推荐/广告系统的原理、架构、模型、验证等。
四、编程实践
1、迭代类机器学习编程入门-求圆周率
2、pagerank的并行化实现(*)
3、逻辑回归算法的java实现
4、决策树c45,id3的java实现
5、随机森林和全树并行化实现
6、训练数据和结果模拟器
7、模型结果规则化处理