课程简介
数据湖构建实战,基于目前大数据领域流行的数据湖技术及方案,结合数据湖在知名互联网及云计算公司的构建案例,从理论和实战的角度介绍数据湖的构建及应用。
课程收益
从实战角度解密流行的数据湖技术及构建方案,使企业快速构建数据湖能力,降低试错的成本。帮助企业厘清数据湖概念,解决大数据应用实战中的问题。
受众人群
从事大数据相关工作的人群
课程周期
1天(6H)
课程大纲
数据湖是什么湖? | 什么是数据湖 原始数据保存的问题 与数据仓库的区别 数据湖的关键技术 数据沼泽与数据治理 数据河与数据源
|
数据湖的架构及战略分析
| 数据湖的常见架构 与数据仓库的关系和并存 数据湖与Hadoop的关系 数据湖与原始数据的关系 数据湖与大数据 数据湖的安全保障 数据湖与元数据
|
数据湖技术分析与实战 | Apache Hadoop数据湖的基础 Apache Kafka数据河流的基础 Apache Hudi数据湖存储 Apache Ranger数据湖安全 Apache Atlas数据湖治理与元数据
|
数据湖的案例分析
| 开源Hadoop数据湖案例分析 Amazon数据湖案例分析 阿里云EMR数据湖案例分析 阿里飞天数据湖案例分析 微软Data lake as service案例分析
|
未来的发展
| 下一代数据仓库 AI驱动 决策自动化 |
John Yang
百林哲咨询(北京)有限公司专家团队成员
John Yang
百林哲咨询(北京)有限公司专家团队成员
John Yang
百林哲咨询(北京)有限公司专家团队成员
John Yang
百林哲咨询(北京)有限公司专家团队成员
John Yang
百林哲咨询(北京)有限公司专家团队成员
John Yang
百林哲咨询(北京)有限公司专家团队成员
John Yang
百林哲咨询(北京)有限公司专家团队成员