简介
随着信息技术的迅速发展,各行各业正产生和积累爆炸式增长的数据。如何通过分析这些规模和复杂度不断增长的数据、挖掘数据的价值来为公司提供商业决策支持,正成为困扰企业高管的一大难题。尽管近年来大数据相关的工具和产品不断涌现。企业利用数据仓库进行大数据分析的门槛依然很高,具体体现在以下几方面:(1)除了以生成报表为代表的传统应用场景,越来越多的企业开始将数据分析作为服务提供给它的员工、客户和合作伙伴,同时在线的用户将达到数百上千的级别。传统MPP架构的数据仓库无法支撑如此高的并发数量。(2)除了传统来自业务系统的结构化数据外,企业数据中心收集和保存了越来越多像地理信息、传感器数据、服务器日志等半结构化和非结构化数据。传统关系型数据库处理这类数据显得越来越力不从心。(3)随着数据量的增多,为了在可接受的时间内完成数据分析,要求数据仓库集群规模不断增大;而传统MPP架构的数据仓库,相对于Hadoop技术来说,恰恰在扩展性上存在很大的局限性。(4)传统数据仓库在系统升级、扩缩容的时候需要停止服务或者进入只读模式,而且时间窗口比较长,严重影响正常的业务。分析完传统数据仓库面临的技术问题后,我们将重点介绍云端数据仓库是如何解决这些问题的:围绕着对象存储和抽象服务构建,通过将管理(元数据)、计算和存储(对象存储)三者分离的创新架构,提供传统解决方案无法媲美的高并发、可扩展、弹性和易用性,包括在线升级(正常的查询完全不受影响)、秒级扩缩容、支持的并发数随集群规模线性增长、几乎无限的计算和存储能力等。
目标
1、在线分析(OLAP)系统的技术分类;
2、OLAP技术选型的最佳实践;
3、数据仓库底层技术干货;
4、最新的云端数据仓库介绍;
5、云端数据仓库使用的最佳实践;
课程时长
1天(6H)
受众人群
数据科学家、数据库管理员、高级工程师、系统架构师、项目经理,以及企业的CIO和CTO。
课程特点
在线分析(OLAP)和数据仓库方面的技术干货+最新云端数据仓库产品的介绍和试用。
分享提纲
AM | 在线分析(OLAP)系统不同的技术路线以及它们尝试解决的问题; 数据仓库的技术; MPP架构的分布式关系型数据库; 传统MPP架构的数据仓库面临的技术问题: 并发数; 半结构化和非结构化数据; 扩展性; 扩缩容; 升级; 云端数据仓库的快速崛起; 云端数据仓库的商业出发点; 云端数据仓库的技术特点; 抽象服务; 弹性伸缩; 在线升级; |
PM | 管理、计算和存储分离,多维度弹性; 云端数据仓库的典型代表; 云端数据仓库HashData的功能特点与实践 HashData的实践试用;HashData |