课程简介
随着企业数字化转型的加速,大数据技术和AI技术的推进,运维管理变得更加智能化。传统的运维方式在监控、问题发现、告警以及故障处理等各个环节均存在明显不足,需要大量依赖人的经验、工作效率低下,并且在数据采集、异常诊断分析、告警事件以及故障处理的效率等方面都有待提高。
智能运维技术作为研发数字化转型的重要手段之一,其应用已非常成熟,但企业在实际落地过程中还是面临重重挑战,对于在组织内转换运维观念,与现有工具结合,提高数据分析效率、实现运维自动化、保障数据安全等问题,都有许多应用实践和经验总结。AIOps的发展趋势需重视传统企业面临的运维痛点,才能更好的支持企业数字化转型,最终达到解决运维效率低下、问题排查周期长、人工成本高昂等运维难题。
本次分享将团队在建设和运维过程中的实践经验的总结,聚焦在智能运维落地场景实践上,解读智能运维的建设和运维过程中的思考和转化。包括智能运维的整体规划、体系架构、实施过程、管理方案等。帮助到更多传统企业了解智能运维(AIOps)技术,提高运维效率和质量,实现企业数字化转型的目标。
本次分享结合eBay基于Istio的应用网关的大规模生产化实践,将eBay Istio生产化部署的架构设计,支持多集群,多环境,多网关的的部署方式呈现,同时通过定义一套eBay内部的API资源在联邦级别管理多种流量治理的社区API资源,实现整个流量治理的生态迁移以及应用流量平滑迁移到Istio.最终在大规模实践中遇到了一些挑战揭示。
课程收益
1.目标:
1) 中大型企业IT在规划和实施智能运维(AIOps)的实践过程
2) 智能运维场景的应用实践案例
3) 探讨AIOps相关的实践和思考,AIOps充分结合了人工智能、机器学习、大数据分析、自动化工具等技术,实现运维效率的提升。
2.成功要素:
1) 符合企业实际的AIOps规划和路线图
2) 人员能力的培养、组织心智的转化要同步,或先于技术和工具
3) 管理过程中要不断衡量业务价值,获得业务或管理层的支持
3.启示
将故障消灭在摇篮中,提质增效。把被动式故障处理变为主动式的风险预防,且是主动+智能方式,让IT更好地适应业务不断变化的需求,高质量的让业务以更快捷的速度应对市场和用户的变化。
受众人群
运维工程师、数据库开发人员、数据管理主管领导、数据管理团队、数据相关项目的解决方案提供者等
课程周期
0.5天(3H)
课程大纲
分享内容 |
1 智能运维(AIOps)的发展前景 2 智能运维的历程、挑战和思考 3 智能运维的应用案例(人机配合的服务台,全栈智能监控,数据分析和决策,自动化运维) 4 智能运维的经验总结和未来展望 5 QA |