云端数据仓库HashData的设计与实现
Carr Jian 查看讲师
百林哲咨询(北京)有限公司专家团队成员
HashData的联合创始人兼CEO,开源分布式数据库Apache HAWQ的committer和Greenplum Database的contributor。拥有10多个国际专利。
浏览:7936次
详情 DETAILS

简介

随着信息技术的迅速发展,各行各业正产生和积累爆炸式增长的数据。如何通过分析这些规模和复杂度不断增长的数据、挖掘数据的价值来为公司提供商业决策支持,正成为困扰企业高管的一大难题。尽管近年来大数据相关的工具和产品不断涌现。企业利用数据仓库进行大数据分析的门槛依然很高,具体体现在以下几方面:(1)除了以生成报表为代表的传统应用场景,越来越多的企业开始将数据分析作为服务提供给它的员工、客户和合作伙伴,同时在线的用户将达到数百上千的级别。传统MPP架构的数据仓库无法支撑如此高的并发数量。(2)除了传统来自业务系统的结构化数据外,企业数据中心收集和保存了越来越多像地理信息、传感器数据、服务器日志等半结构化和非结构化数据。传统关系型数据库处理这类数据显得越来越力不从心。(3)随着数据量的增多,为了在可接受的时间内完成数据分析,要求数据仓库集群规模不断增大;而传统MPP架构的数据仓库,相对于Hadoop技术来说,恰恰在扩展性上存在很大的局限性。(4)传统数据仓库在系统升级、扩缩容的时候需要停止服务或者进入只读模式,而且时间窗口比较长,严重影响正常的业务。分析完传统数据仓库面临的技术问题后,我们将重点介绍云端数据仓库是如何解决这些问题的:围绕着对象存储和抽象服务构建,通过将管理(元数据)、计算和存储(对象存储)三者分离的创新架构,提供传统解决方案无法媲美的高并发、可扩展、弹性和易用性,包括在线升级(正常的查询完全不受影响)、秒级扩缩容、支持的并发数随集群规模线性增长、几乎无限的计算和存储能力等。

目标

1、在线分析(OLAP)系统的技术分类;
2、OLAP技术选型的最佳实践;
3、数据仓库底层技术干货;
4、最新的云端数据仓库介绍;
5、云端数据仓库使用的最佳实践;

课程时长

1天(6H)

受众人群

数据科学家、数据库管理员、高级工程师、系统架构师、项目经理,以及企业的CIO和CTO。
课程特点
在线分析(OLAP)和数据仓库方面的技术干货+最新云端数据仓库产品的介绍和试用。

分享提纲

AM 在线分析(OLAP)系统不同的技术路线以及它们尝试解决的问题;
 数据仓库的技术;
 MPP架构的分布式关系型数据库;
 传统MPP架构的数据仓库面临的技术问题:
 并发数;
 半结构化和非结构化数据;
 扩展性;
 扩缩容;
 升级;
 云端数据仓库的快速崛起;
 云端数据仓库的商业出发点;
 云端数据仓库的技术特点;
 抽象服务;
 弹性伸缩;
 在线升级;
PM

 管理、计算和存储分离,多维度弹性;
 云端数据仓库的技术基础;
 元数据服务;
 对象存储;
 一致性哈希算法;

 云端数据仓库的典型代表;

 云端数据仓库HashData的功能特点与实践
 HashData的功能特点;

 HashData的实践试用;HashData



预约内训 APPLY
前往提交您的需求,我们会及时与您联系
课程推荐 COURSE

企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1