职位详情
岗位职责:
- 负责AI集群计算性能的分析与调优,定位系统瓶颈并实施优化方案
- 提升GPU内核运行效率,优化CUDA内核设计、显存访问结构及GPU流水线调度
- 优化多节点多卡环境下分布式通信库的传输性能,推进计算与通信的并行化优化
任职要求:
- 具备4年及以上AI集群计算性能调优相关工作经验
- 熟悉主流AI计算框架在计算、编译及通信层面的优化技术
- 有NCCL、MPI等分布式通信库性能调优经验者优先考虑
- 熟练运用GPU性能剖析工具完成性能问题识别与根因分析
- 具备较强的逻辑思维与问题解决能力,能够高效协同跨团队协作
- 关注云计算领域前沿技术,具备良好的学习能力与工程实践能力
- 负责AI集群计算性能的分析与调优,定位系统瓶颈并实施优化方案
- 提升GPU内核运行效率,优化CUDA内核设计、显存访问结构及GPU流水线调度
- 优化多节点多卡环境下分布式通信库的传输性能,推进计算与通信的并行化优化
任职要求:
- 具备4年及以上AI集群计算性能调优相关工作经验
- 熟悉主流AI计算框架在计算、编译及通信层面的优化技术
- 有NCCL、MPI等分布式通信库性能调优经验者优先考虑
- 熟练运用GPU性能剖析工具完成性能问题识别与根因分析
- 具备较强的逻辑思维与问题解决能力,能够高效协同跨团队协作
- 关注云计算领域前沿技术,具备良好的学习能力与工程实践能力
2026-06-28 13:54
IP属地:北京
职位福利
本科5-10年CUDAC++Linux开发/部署经验分布式高性能

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








