结盟众多企业“教练”, 共同设计、开发及提供人才培养解决方案,通过新颖多样的学习方式,针对性的定制化内容,助力企业全面提升竞争优势。
Peter彭
2天
5200元
主题 | 内容 |
---|---|
数据挖掘的理解及挖掘模型建设过程 |
1.数据挖掘的机遇与挑战深入分析 侧重:在互联网下的数据分析与挖掘应用场景,互联网思维带来的模型变革。 2.数据挖掘关键点:商业目标(如何转为技术) 营销方案(结果应用) 3.数据挖掘DM的6个步骤(重点): 1)业务理解 2)数据理解 3)数据准备 4)模型设计 5)模型评估 6)模型部署 侧重:讲解每个步骤的同时,加入分析失败和成功的案例。让学员更能明白和理解每个步骤的价值意义及如何操作。 4.数据挖掘的认识误区 |
数据分析技术 |
1.数据分析的特点及价值 2.数据分析的设计模型三层次 (概念模型、逻辑模型、物理模型) 3.多维模型(OLAP)的设计及应用 |
数据模型的三种结构设计思路 |
三种数据模型结构: 雪花模型、星型模型、雪花星型模型 |
大数据时代数据挖掘的特点及应用案例分析简要 |
1. 中国大数据市场分析 2.大数据应用需求分析 3.大数据应用案例分析 4.大数据行业应用 |
数据挖掘应用思考 |
经营分析岗位相关人看数据分析的角度 1)决策层:市场部、公司决策层 2)分支机构:地市分公司 3)支撑部门:财务/计费 4)其他相关人: 集团/用户/股东/竞争对手等 |
数据挖掘的分析方法与算法 |
1.关联分析方法 1)关联分析的理解 简单关联、时序关联、因果关联。 层关联规则和多层关联规则 单维关联规则和多维关联规则 2)典型算法 AIS 算法(R. Agrawal等提出) Apriori算法(AprioriTid和AprioriHybrid)–重点 SETM 算法(M. Houtsma等提出) DHP 算法(J. Park等提出) PARTITION 算法(A.Savasere等提出) Sampling 算法(H.Toivonen提出) FP-growth 算法(Jiawei Han提出) 3)算法实现及例子 2.分类分析 1)对分类的理解 分类模型可表示为:分类规则、决策树或数学公式 KNN分类 SVM分类 VSM分类 2) 常见的分类算法 决策树算法---重点 CLS算法 ID3算法 C45算法 Autoclass算法 3)算法实现及例子 3.聚类 1)对聚类的理解 • 基于划分的聚类方法 • 基于层次的聚类方法 • 基于密度的聚类方法 • 基于网格的聚类方法 • 基于模型的聚类方法 2)常见的聚类算法 CURE算法 K均值算法 K中心点算法 C均值算法 CHAMELEON算法 3)算法实现及例子 4.预测 1)预测分析方法与算法 预测的主要方法回归 – 线性回归和多元回归 – 非线性回归 传统的预测方法 • 趋势外推法 • 时间序列法 • 回归分析法等 现代预测: • 人工神经网络(ANN)预测方法 • 专家系统预测方法 • 模糊预测方法 • 小波分析预测方法 • 优选组合预测方法等 2)算法实现及例子 5.偏差检测 1)偏差检测的理解 2)异常点检测的方法及案例 6.概念/类描述(细分分析暨特征分析) 1)细分分析的理解 2)典型算法:面向属性的归纳方法(AOI),决策树 3)算法实现及例子 |
数据挖掘在行业应用下的案例及实践操作 |
1.关联分析及决策树算法的应用实践建模 (以关性和决策树算法作为入口,进行建模实践) 2.异常点进行欺诈探测的应用实践建模(以神经网络建模实践) 3.通过时间序列预测产品分类销售情况的建模实践(回归分析建模实践) 4.客户流失预测模型建设及实践(客户细分分析及流失预测模型) |
数据挖掘及管理经验交流 |
1.数据挖掘项目失败原因 2.数据挖掘实施的关键性工作 3.数据挖掘的过程管理 |