课程简介
随着业务发展和微服务的大行其道,给系统引入了更多的复杂性,微服务体系中任何一个环节发生故障都有可能对业务造成灾难影响,这对如何建设高可用性、强容错性、可观测性的服务治理体系提出了更高的要求。混沌工程通过主动攻防的方式,验证系统架构、组织机制、人员能力在应急防御时的有效性,从而及时对脆弱点进行加固,保障业务高速发展时系统的稳态运行。
携程经过对混沌工程的探索,逐步演化出了故障演练平台及常态化演练标准,本次将介绍携程在混沌工程落地方面的实践经验。
课程收益
1. 目标:
理解混沌工程的原理并了解其在企业内落地的方案
2. 要点:
① 如何针对典型历史故障设计实验场景;
② 如何度量系统稳态;
③ 如何控制爆炸半径;
④ 如何实现自动化演练;
⑤ 如何在企业内落地及推广。
受众人群
测试工程师、研发工程师、架构师、运维工程师以及对混沌工程感兴趣的人员
课程周期
1天
课程大纲
1. 混沌工程的背景
在复杂的微服务架构下,如何应对无处不在的故障
2. 携程混沌工程体系建设
以混沌工程”五条原则“及“成熟度模型”为指导,结合携程现状,建设故障演练平台
3. 携程混沌工程实战案例分享
从单一应用演练到数据中心演练
从人工值守演练到自动化演练
4. 未来规划与思考
拥抱面向失效设计的文化
持续降低演练成本
建立全面的演练管理体系
5 . QA