大数据技术在汽车行业的应用
John Yang 查看讲师
百林哲咨询(北京)有限公司专家团队成员
硅谷海归软件工程师、架构师,曾供职阿里巴巴云梯、飞天及计算平台任高级技术专家
浏览:2212次
详情 DETAILS

课程简介

从实战角度解密大数据的技术原理与架构,结合汽车行业的应用,使企业快速掌握大数据技术原理和构建能力,降低试错的成本。帮助企业厘清概念,解决实战中的问题。

课程特色

基于互联网行业十年的经验,结合汽车行业的应用,从理论到实践介绍大数据及数据分析技术。

受众人群

所有对《大数据技术在汽车行业的应用》感兴趣的学员

有一定软件开发经验的软件工程师、架构师。

IT部门相关员工及管理者。

课程周期

1天(6H)

课程大纲

大数据技术前世今生(Day 1

数据到大数据的发展历程

集中式数据系统到数据平台

系统成本压力与收益

数据平台的基本业务

ETL业务

离线计算业务

实时计算业务

Kappa架构和Lambda架构

推荐算法与机器学习业务

商业智能与报表业务

数据产品化及数据化运营

数据平台的基本构成

文件存储系统

计算系统

资源调度系统

结构化存储引擎

有向无环图系统

上层查询引擎

作业调度管理系统

CDH Hadoop生态系统举例

Hadoop分布式文件系统 Hadoop Distributed File System(HDFS)

HDFS组件与原理

Namenode主结点Master结点

Datanode从结点Slave结点

HDFS存储原理

应对集群故障

HDFS小文件管理

Hadoop分布式调度系统Yet Another Resource Negotiator() (Day 1 PM)

Resource Manager 主结点Master结点

Node Manager 从结点Slave结点

Application Master 应用可扩展主结点

开发自定义分布式计算程序

队列分配与资源分配

离线与在线混合部署

离线计算引擎 MapReduce

MapReduce基本原理

MapReduceYarn上实现

Shuffle的基本原理

Shuffle的调优

离线及实时计算引擎Spark

Spark的基本原理

Spark的架构

开发一个Spark应用程序

Spark实际运算过程解析

使用Spark时注意的问题

消息中间件Kafka  (Day 2)

Kafka架构

Kafka基础原理

Kafka应用实践

Kafka常用配置

Kafka调优

上层查询引擎Hive

Hive架构

Hive基本原理

大数据系统的元数据

Hive应用实践

数据倾斜问题

Hive 调优

作业调度管理系统

AirFlow原理及使用

Oozie原理及使用

阿里云天网原理及使用

数据抽取的工具和方法

Sqoop原理及使用

DataX原理及使用

数据抽取与SAP ERP结合

数据抽取与MES结合

注意事项

案例:接入微软D365 ERP系统

数据清洗的方法

DQC数据质量控制与检测

离线抽取方式与调度

实时抽取方式

异常的处理与恢复

数据展示与业务支持

Hadoop数据展示与Business Objects结合

Hadoop数据展示与Tableau结合

其它基于Hadoop的数据展示工具

总结与讨论


企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1