课程简介
在数字化转型的浪潮下,随着云原生技术的不断成熟,企业数字化转型也在不断加速,企业IT架构进入云原生时代,多云多集群部署已经成为常态和趋势,几何增长的云资源、微服务以及复杂化的调用关系与业务场景,传统人肉运维难以为继。如何保障系统的全面稳定,保证业务流程的高效运转,为系统运营提出了不小的挑战。
在云原生时代下,系统稳定性必须将安全生产保障左移,在入网控制之前介入,对入网控制、发布上线、故障预防、故障发现、故障定位,故障恢复、故障改进提供端到端工具支撑。
本次分享将围绕安全生产保障体系建设思路,以及端到端、全层级、全流程的系统全生命周期稳定性保障工具建设视角,展现可观测性建设、系统稳定性管理等领域的实践经验。
课程收益
1.目标
(1)管理体系+技术体系结合视角,解读安全生产保障体系落地思路
(2)以平台+应用模式构建系统全生命周期稳定性保障工具建设思路
(3)横向到边、纵向到底的全层级全链路可观测性建设落地实践思路
2.成功要点
(1)基于云原生下的生产运营支撑平台,以全局运营视角解读IT运维,提供端到端、全层级的运维工具支撑。
(2)依托大数据与人工智能技术,助力企业数字化业务高效、稳定运行,从传统运维向自动化生产、智慧化运营转变。
3.启示
让企业运维数字化转型中提前发现风险隐患,可观测快速发现并定位问题,持续优化改进,有效压缩故障时长,全面提升系统稳定性。
受众人群
运维工程师、运维开发工程师、研发工程师、架构师、技术管理者
课程周期
0.5天/3小时
课程大纲
1系统稳定性痛点挑战
云原生场景下的企业运维数字化转型痛点挑战
2安全生产保障体系
阐述安全生产保障体系的落地实践(制度、组织、工具、运营)
3稳定性保障工具实践
数字化监控平台工具能力(可观测性、稳定性保障、故障管理等)
4 QA