大数据建模与模型优化实战
Ian Fu 查看讲师
百林哲咨询(北京)有限公司专家团队成员
曾任华为技术专家,五篇技术专利,工作期间获得华为数项奖项,曾在英国、日本、荷兰等国家做项目,对大数据有深入的研究。
浏览:7434次
详情 DETAILS

简介

课程核心内容为大数据建模、模型优化、业务专题分析。采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。

目标

1、帮助学员掌握从平台搭建到数据分析再到数据价值的挖掘各个方面的实用知识并实现提升部门或公司的业绩

2、掌握大数据建模、分析挖掘技术体系及其平台方案实现

3、掌握常用的时间序列模型,掌握时序建模的基本思想、适用场景及要求

4、掌握如何针对时序特点选取最合适的拟合模型,如何对模型做出适当的优化措施

受众人群

大数据工程师、市场营销部经理、产品设计人员、运营分析部经理等主管

课程时长

2天(12H)

学员要求

1.每个学员自备一台便携机(必须)。

2.便携机中事先安装好Excel 2013版本及以上。

3.便携机中事先安装好IBM SPSS Statistics v19版本及以上。

4.便携机中事先安装好IBM SPSS Modeler v14版本及以上。

注:讲师可以提供试用版本软件及分析数据源。

授课方式

数据分析基础 + 方法讲解 + 实际业务问题分析 + 工具实践操作

采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。

分享提纲

第一部分: 数据建模篇

1、 预测建模六步法

2、 第一步:属性筛选(降维)

Ø 需要选择哪些属性?如何派生新属性?

Ø 常用方法:显著性检验、主成分分析…

Ø 从业务逻辑和数据逻辑来考虑

3、 第二步:选择模型

Ø 常用模型分类

Ø 各模型适用场景

Ø 基于业务场景选择合适的模型

4、 第三步:训练模型

Ø 利用数据对模型进行计算

Ø 模型参数优化和调整

Ø 算法:最优求解、距离、概率、信息增益…

5、 第四步:评估模型

Ø 评价常用指标:R^2,AUC,KS,误差率,错误率…

Ø 评估方法:留出法、N拆交叉验证、过拟合

6、 第五步:优化模型

Ø 模型优化方向:模型和数据

Ø 优化模型:调整模型、优化公式、优化算法

Ø 优化数据:新增属性、重新构造属性

7、 第六步:应用模型

Ø 模型解读:模型含义、输出结果

Ø 部署模型:开发模型、模型周期维护

8、 数据预测模型优化

Ø 显著性检验、线性检验、非线性检验、相互作用检验、共线性检验、误差项检验、过拟合检验

9、 分类预测模型优化

Ø Bagging算法

Ø Boosting算法

第二部分: 时间序列分析篇

1、 如何对趋势和季节性建模

2、 时间序列及常用模型算法

3、 使用移动平均来消除季节性因素

Ø 一次移动平均原理及其缺点

Ø 二次移动平均原理及其公式

Ø 加权移动平均原理及其公式

案例:平板电脑销量分析

4、 指数平滑

Ø 一次指数平滑原理及其公式

Ø 二次指数平滑原理及其公式

Ø 三次指数平滑原理及其公式

案例:煤炭产量分析

5、 Holt-Winters分析

Ø 霍尔特-温特斯原理

Ø HW无季节模型及公式

Ø HW加法模型

Ø HW乘法模型

6、 季节性和趋势预测模型

Ø 相加模型

Ø 相乘模型

7、 评估模型质量的指标

Ø 判定系数R^2

Ø 标准误差SER

8、 评估预测值准确程度的指标

Ø 平均偏差MAD

Ø 均方差MSE或均方差平方根RMSE

Ø 平均误差率MAPE

第三部分: 降维技术

1、 变量太多存在的问题

2、 数据稀疏的问题

3、 变量降维技术的类型

Ø 利用业务知识选择属性

Ø 利用数据本身特征来选择属性

Ø 利用自变量和因变量的相关性来选择属性

Ø 将不显著因素合并为显著因子(PCA)

4、 利用决策树来选择变量

5、 使用神经网络来选择变量

6、 利用变量聚类

第四部分: 优化问题建模

1、 优化问题的三个特点

Ø 可调整的参数

Ø 产生单一目标值的目标函数

Ø 参数的约束条件

2、 解决优化问题的常用算法

Ø 线性规划

Ø 遗传算法

3、 线性规划应用建模

4、 遗传算法

Ø 遗传算法的基本框架

Ø 改进及增强:选择、交叉

第五部分: 产品最优定价及定价策略分析

1、 产品最优定价是一个优化问题

2、 常见的定价方法

3、 产品定价的理论依据

Ø 需求曲线与利润最大化

Ø 如何求解最优定价

案例:产品最优定价求解

4、 如何评估需求曲线

Ø 价格弹性

Ø 曲线方程(线性、乘幂)

5、 如何做产品组合定价

6、 如何做产品捆绑/套餐定价

Ø 最大收益定价(演进规划求解)

Ø 避免价格反转的套餐定价

案例:电信公司的宽带、IPTV、移动电话套餐定价

7、 非线性定价原理

Ø 要理解支付意愿曲线

Ø 支付意愿曲线与需求曲线的异同

案例:双重收费如何定价(如会费+按次计费)

8、 阶梯定价策略

案例:电力公司如何做阶梯定价

9、 数量折扣定价策略

案例:如何通过折扣来实现薄利多销

10、 定价策略的评估与选择

案例:零售公司如何选择最优定价策略

11、 航空公司的收益管理

Ø 收益管理介绍

Ø 如何确定机票预订限制

Ø 如何确定机票超售数量

Ø 如何评估模型的收益

案例:FBN航空公司如何实现收益管理(预订/超售)

第六部分: 客户需求与产品设计建模

1、 联合分析法

2、 离散选择模型

Ø 如何评估客户购买产品的概率

Ø 如何指导产品开发?如何确定产品的重要特性

Ø 竞争下的产品动态调价

Ø 如何评估产品的价格弹性

案例:产品开发与设计分析

案例:品牌价值与价格敏感度分析

案例:纳什均衡价格

3、 品牌价值评估

4、 新产品市场占有率评估

第七部分: 精准推荐模型

1、 从搜索引擎到推荐引擎

2、 个性化推荐系统的应用场景

3、 推荐系统的评测

Ø 用户满意度

Ø 预测准确度

Ø 覆盖率…

4、 常用产品推荐模型及算法

Ø 分类预测

Ø 关联分析

Ø 协同过滤

Ø …

5、 个性化精准营销的推荐策略

结束:课程总结与问题答疑




企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1