简介
互联网高速发展的今天,海量大数据集群自动化智能化管理和监控是一个挑战, 全自动化的集群运维体系构建,可以为企业在人力和成本上做出很大的节约。一个创业公司大数据集群规模从0到数万台规模短短的几年时间,我们在管理和监控上面临着很大的挑战。迎接挑战,从机器管理到集群,部署到监控,自动化到智能化等各方面展开,分享大数据运维体系平台构建的一些经验。
目标
从自动化走向智能化等方面的设计实现,对即将做、正在做、已经做的大数据运维相关企业都有受益
成功点
大数据运维体系构建给予启迪和指导,如何做安全,如何做管理,如何做监控,如何控制成本。
收益
从机器管理到集群,部署到监控,自动化到智能化等各方面展开,了解大数据运维体系平台构建的一些经验。
受众人群
运维、开发、架构及DevOps工程师
对大数据运维感兴趣的技术人员
课程时长
1天(6H)
分享提纲
第一部分 | 1.1 平台架构演变 1.2 大数据技术框架 1.3 大数据运维存在的问题 | |
第二部分 | 小米大数据运维平台体系构建 | 2.1 运维规范 2.2 部署系统体系设计 2.3 统一监控和统一告警 2.4 集群安全账号系统设计 2.5 资源可视化,成本化 2.6 安全审计 |
第三部分 | 大数据思维做运维监控 | 3.1 设计与实现 3.2 大数据思维 |
第四部分 | 智能化大数据运维探索与思考 | 4.1 探索 4.2 思考 |