课程简介
AI领域正经历着一场深刻的变革,这不仅大大加速了相关应用的发展,也导致了GPU的短缺。如何提高GPU资源的利用效率并缩短项目的落地时间,已经成为每个企业急需解决的问题。
本课程对机器学习业务落地中的痛点进行了详细调研,总结了不同业务部门都面临的开发与生产环境的割裂、工程师和数据科学家之间的高沟通成本,线上资源使用率的保障等挑战。同时,生成式AI领域的快速发展,也带来了大量新的业务模式,这些模式同样需要新的能力支撑。为此,设计了下一代机器学习平台,从平台角度出发,全面支持公司内部的所有机器学习业务。
本次分享将结合实际案例,探讨Ray在四个关键生产场景中的应用:1)批量推理、2)近实时特征工程、3)分布式训练、4)AI服务构建。详细讨论每个场景下所面临的具体挑战,并提供应对这些挑战的解决方案。
课程收益
1、帮助学员了解Ray在生产场景中的应用
2、深入剖析提高GPU的利用效率,帮助企业加快AI项目的迭代速度
受众人群
企业管理者,IT行业从业者及其他对Ray感兴趣的人员
课程周期
3H
课程大纲
1、机器学习平台领域的背景与挑战
2、需求分析:eBay下一代机器学习平台的业务背景
3、Ray和MLP2.0:通过平台能力服务业务需求
4、业务案例分析:新一代机器学习平台在业务落地中的应用
1) 批量推理
2) 近实时特征工程
3) 分布式训练
4) AI服务
5、平台经验分享:
1) 系统架构设计
2) 开源社区协作
6、QA