职位详情
职位描述
1. 负责AI异构计算软件栈的研发工作,基于多种加速芯片的架构特点,实现从底层到应用层的全链路性能优化,支撑构建高可靠、高性能、高效率的大规模AI算力平台;
2. 面向实际业务需求,推进软硬件协同设计与技术突破,涵盖算子级优化、编译优化、系统资源调度、分布式推理等关键技术环节,提升系统整体性能并降低运行成本;
3. 跟踪人工智能与深度学习领域的前沿进展,参与下一代AI计算基础设施的架构设计与核心技术攻关;
4. 打造高效能AI基础系统,通过软硬一体化手段优化计算效率,尤其在AIGC大模型应用场景中,融合模型算法与硬件能力,充分释放协同优化空间,达成极致性能与成本控制目标;
5. 与多职能团队紧密配合,深入挖掘行业应用场景和技术演进方向,推动创新技术方案在各产品体系中的集成与落地,增强解决方案的技术领先性与市场适应性;
6. 建立和完善AI异构计算相关技术文档与实践指南,支持内部知识传递与能力建设,助力团队技术水平和创新能力的持续提升。
职位要求
1. 具备扎实的编程基础,熟练掌握C++、Python等开发语言;
2. 深入理解GPU(或同类AI加速器)体系结构,具备实际的系统开发与性能调优经验;
3. 熟悉主流深度学习框架(如PyTorch),了解其底层机制,在模型训练或推理阶段有性能优化的实际项目经历;
4. 掌握主流大模型的网络结构与执行流程,熟悉常见推理优化方法与技术路径;
5. 具备良好的沟通协调能力和项目管理意识,能够与跨领域团队高效协作,合理规划任务进度,保障项目高质量交付。
拥有以下背景者优先
a. 熟练使用主流GPU算子开发工具(如Cutlass、Triton)及性能剖析工具;
b. 参与过深度学习框架或大模型推理引擎(如vLLM、PyTorch)的开发与优化工作;
c. 具备异构计算、程序编译等相关领域的研发经验;
d. 具有高性能分布式系统设计与实践经验。
1. 负责AI异构计算软件栈的研发工作,基于多种加速芯片的架构特点,实现从底层到应用层的全链路性能优化,支撑构建高可靠、高性能、高效率的大规模AI算力平台;
2. 面向实际业务需求,推进软硬件协同设计与技术突破,涵盖算子级优化、编译优化、系统资源调度、分布式推理等关键技术环节,提升系统整体性能并降低运行成本;
3. 跟踪人工智能与深度学习领域的前沿进展,参与下一代AI计算基础设施的架构设计与核心技术攻关;
4. 打造高效能AI基础系统,通过软硬一体化手段优化计算效率,尤其在AIGC大模型应用场景中,融合模型算法与硬件能力,充分释放协同优化空间,达成极致性能与成本控制目标;
5. 与多职能团队紧密配合,深入挖掘行业应用场景和技术演进方向,推动创新技术方案在各产品体系中的集成与落地,增强解决方案的技术领先性与市场适应性;
6. 建立和完善AI异构计算相关技术文档与实践指南,支持内部知识传递与能力建设,助力团队技术水平和创新能力的持续提升。
职位要求
1. 具备扎实的编程基础,熟练掌握C++、Python等开发语言;
2. 深入理解GPU(或同类AI加速器)体系结构,具备实际的系统开发与性能调优经验;
3. 熟悉主流深度学习框架(如PyTorch),了解其底层机制,在模型训练或推理阶段有性能优化的实际项目经历;
4. 掌握主流大模型的网络结构与执行流程,熟悉常见推理优化方法与技术路径;
5. 具备良好的沟通协调能力和项目管理意识,能够与跨领域团队高效协作,合理规划任务进度,保障项目高质量交付。
拥有以下背景者优先
a. 熟练使用主流GPU算子开发工具(如Cutlass、Triton)及性能剖析工具;
b. 参与过深度学习框架或大模型推理引擎(如vLLM、PyTorch)的开发与优化工作;
c. 具备异构计算、程序编译等相关领域的研发经验;
d. 具有高性能分布式系统设计与实践经验。
2026-05-15 14:09
IP属地:上海
职位福利
硕士3-5年编译器开发经验C++Linux开发/部署经验Python

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









