课程简介
随着企业越来越深入的应用生成式AI,生成式AI应用的部署规模也随之扩大。但由于生成式AI应用资源要求高,传统架构面临如自动扩容不够灵敏,新实例冷启动时间长,实例和存储成本高昂等挑战。
面对这一挑战,亚马逊云科技设计了基于亚马逊云和Kubernetes的Stable Diffusion大规模部署参考架构。其架构充分利用容器技术,可灵敏的弹性伸缩和快速冷启动。同时,利用公有云的资源弹性,灵活定价方式和无服务器技术,减少实例和运维成本并优化性能。
本次分享与探讨K8S大规模部署生成式AI应用场景提供了架构指引和最佳实践,有效平衡了成本、性能和运维效率,为与会者提供最前沿的价值借鉴。
课程收益
1、帮助学员了解应用云和Kubernetes实现高性能,高可用和快速扩展的Stable Diffusion部署;
2、帮助学员了解使用基础设施即代码(IaC)快速部署和管理应用和基础设施
3、帮助学员了解应用云的弹性和多种定价方式实现成本优化
4、帮助学员了解利用云上托管服务和无服务器技术来实现卓越运维
受众人群
企业管理者,IT行业从业者及其他对K8S大规模部署生成式AI感兴趣的人员
课程周期
3H
课程大纲
1、Stable Diffusion及其生态系统
2、当前常见的大规模部署方案,及其架构痛点
3、基于亚马逊云科技和Kubernetes的Stable Diffusion大规模部署方案
4、探讨快速构建符合良好架构的生成式AI应用
5、QA