课程简介
在全球AI浪潮与政策推动下,AI大模型掀起全球人工智能浪潮,算力作为其基础“底座”至关重要。各地政策推动算力发展,优化布局,形成了积极的产业环境。构建高效、灵活、稳定的云原生算力管理平台,成为加速大模型落地实践的关键。
云技术以AI浪潮为契机,对算力管理平台的发展与痛点进行了深入细致调研,总结了不同算力供应商都面临的异构或异地算力的难以管理、算力供应与需求之间的矛盾、算力资源利用率的提升等问题与挑战。同时,围绕云原生的能力与价值,确定了云原生是算力基础设施建设的核心技术。为此,设计了基于云原生的算力管理平台,使大规模的训练、推理任务更为高效、可控。
本次分享主要聚焦帮助企业构建云原生算力架构,最大化发挥算力资源效能,让大模型的研发人员能够更好地聚焦于模型的创新、算法的突破,为各行各业的发展提供更为强大的动力。
课程收益
1、帮助学员了解云原生算力基础设施的概念和原理
2、帮助学员拓展对现代科技基础设施的认知
3、深入研究云原生算力架构,驱动大模型创新实践,借助实际案例,更好的帮助企业支撑需求,加快大模型迭代开发
受众人群
企业管理者,IT行业从业者及其他对云原生算力基础设施感兴趣的人员
课程周期
3H
课程大纲
标题 | 授课内容 |
一、大模型趋势 | 1. 算力对大模型创新实践的重要性 |
二、面向大模型的云原生算力架构关键要素 | 1. 整合异构分散算力形成强算力 2. 分布式并行架构支持大模型的创新效率 3. 灵活扩展保证算力底座的可用性 |
三、面向大模型的云原生算力架构技术介绍 | 1. 技术架构详解 2. 双层调度器调度调度原理 3. 细粒度资源计费计量技术 4. 模型即服务-云原生AI平台 |
四、未来展望 | 1. 未来展望 2. QA |