致力于提升研发企业的持续创新能力

结盟众多企业“教练”, 共同设计、开发及提供人才培养解决方案,通过新颖多样的学习方式,针对性的定制化内容,助力企业全面提升竞争优势。

课程分类列表

大数据落地核心技术系列课程之——大数据挖掘
课程类别:大数据

大数据存储

课程讲师:

Peter彭

课程周期:

2天

课程费用:

4000元/人

课程介绍:
数据挖掘和机器学习是属于大数据的核心技术之一,以科学严谨的数据依据帮助企业做分析决策,同时其高深的理论门槛也阻挡了广大工程师的学习上手,在大数据时代,如何进行基于海量数据在成百上千的机器进行分布式数据挖掘更是需要解决的难题,本课程从实战角度出发,基于企业实际需求,深入浅出的讲解数据挖掘最常用的算法和企业场景,让工程师通俗易懂的掌握,并且进行编程落地实践培训,让抽象的算法公式完全落地为工程化的程序为企业所用。
主题 内容
一、大数据分析挖掘技术介绍 1、map/reduce
2、mahout数据挖掘
3、sql on hadoop
4、spark生态体系
5、R语言
6、MPI并行计算
7、GPU并行计算(深度学习)
8、java并行计算框架
二、常用机器学习算法原理 1、决策树
2、随机森林
3、协同过滤推荐算法(余弦相似、修正余弦)
4、Jaccard算法
5、朴素贝叶斯算法
6、k-means聚类算法
7、pagerank算法
8、逻辑回归
9、神经网络深度学习
10、图计算
三、大数据挖掘业务场景和生产平台 1、互联网金融业务—如何构建阿里金融系统
2、银行客户需求业务
3、大数据分析生产平台
4、推荐/广告系统的原理、架构、模型、验证等。
5、基于GBDT的组合模型架构
四、编程实践(动手) 1、迭代类机器学习编程入门-求圆周率
2、pagerank的并行化实现(*)
3、逻辑回归算法的java实现
4、决策树c45,id3的java实现
5、随机森林和全树并行化实现
6、训练数据和结果模拟器
7、模型结果规则化处理
8、协同过滤java实现
9、基于图计算的推荐java实现
10、神经网络算法的70行java代码实现
找到所需课程了吗?即刻 填写申请表格 与我们联络吧