职位详情
1. 负责AI基础软件平台的开发与性能调优,满足阿里云客户在人工智能基础设施方面的实际应用需求;
2. 持续关注行业前沿技术进展,推动新技术在业务场景中的落地,包括新型硬件架构、异构计算体系及大模型系统技术的集成与应用;
3. 面向AI计算场景,设计并实现CPU/GPU等多元算力环境下的显存管理机制与计算加速方案;
4. 结合操作系统层能力,协同优化AI框架以提升模型推理效率,减少大规模模型部署的资源开销;
5. 与产品团队高效协作,推进关键技术成果的产品化实施与规模化推广。
职位描述
* 8年以上相关技术领域工作经验,具备深厚的计算机系统理论基础,熟练掌握C/C++/Rust/Python等编程语言;
* 在以下一个或多个方向具有实际项目经验:
1. 精通C/C++开发,深入理解CUDA编程模型、多线程并发机制及异构计算平台,具备一线开发实践经历;
2. 参与过主流AI框架(如PyTorch/vLLM)的开发工作,熟悉其内部运行机制与底层优化逻辑,有vLLM社区贡献经验者优先;
3. 掌握大模型系统层面的设计与优化方法,了解Prefill/Decoding架构、Speculative Decoding等关键技术。
* 具备大模型训练与推理系统的性能调优经验者优先考虑;
* 具备出色的系统问题分析与解决能力,能在复杂环境中精准定位性能瓶颈并实施有效优化;
* 对前沿技术保持高度敏感,富有探索精神,具备良好的沟通协作能力和团队合作意识。
2. 持续关注行业前沿技术进展,推动新技术在业务场景中的落地,包括新型硬件架构、异构计算体系及大模型系统技术的集成与应用;
3. 面向AI计算场景,设计并实现CPU/GPU等多元算力环境下的显存管理机制与计算加速方案;
4. 结合操作系统层能力,协同优化AI框架以提升模型推理效率,减少大规模模型部署的资源开销;
5. 与产品团队高效协作,推进关键技术成果的产品化实施与规模化推广。
职位描述
* 8年以上相关技术领域工作经验,具备深厚的计算机系统理论基础,熟练掌握C/C++/Rust/Python等编程语言;
* 在以下一个或多个方向具有实际项目经验:
1. 精通C/C++开发,深入理解CUDA编程模型、多线程并发机制及异构计算平台,具备一线开发实践经历;
2. 参与过主流AI框架(如PyTorch/vLLM)的开发工作,熟悉其内部运行机制与底层优化逻辑,有vLLM社区贡献经验者优先;
3. 掌握大模型系统层面的设计与优化方法,了解Prefill/Decoding架构、Speculative Decoding等关键技术。
* 具备大模型训练与推理系统的性能调优经验者优先考虑;
* 具备出色的系统问题分析与解决能力,能在复杂环境中精准定位性能瓶颈并实施有效优化;
* 对前沿技术保持高度敏感,富有探索精神,具备良好的沟通协作能力和团队合作意识。
2026-05-14 13:51
IP属地:北京
职位福利
本科5-10年vLLMC++C大模型CPU/GPU

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









