课程简介
近年来,实时数仓在许多行业和领域中都得到了广泛的应用,如金融、零售、制造业、互联网等。它可以帮助企业和组织实时监测业务数据,快速响应市场变化,提高业务决策的效率和准确性。实时数仓的建设能力成为了衡量企业数字化程度的重要因素。流式计算技术在实时数仓中充当了非常重要的角色,为实时数仓提供了实时收集、转化、加工等重要的基础能力,极大的降低了实时数仓的应用成本。
而在流式计算中,经常需要和各种外部系统进行交互,用维度表补全事实表中的字段。区别于离线计算中的场景,维表在流式计算中有着单独的语义表达和实现。同时随着业务场景的逐渐丰富,维表关联面临了许多不同的挑战和问题,本次分享将详细介绍企业在流式计算场景中遇到的各种维表关联的问题及解决方案。
课程收益
目标:
介绍流式计算场景下维表关联面临的各种问题及挑战。
成功要点:
1 对于维表关联问题的深度剖析及问题抽象;
2 对于丰富的业务场景理解及建模;
3 字节内部流批统一的丰富处理实践;
启示:
大规模云原生大数据维表关联的难点和经验,为与会者提供跨流式计算中维表关联问题的解决思路和优化方案。
受众人群
产品经理,架构师,技术人员,数据挖掘师,数据分析师和其他对于产品优化感兴趣的人员。
课程周期
0.5天/3小时
课程大纲
1. 维表关联的背景介绍及流式计算中的基本概念
2. 点查维表面临的问题及解决方案
3. 广播维表的引入及解决的问题
4. 流式计算中维表的总结