职位详情
社招校招同步开放~
工作内容:
打造行业领先的大语言模型推理底层架构,围绕量化压缩、高效解码、算子加速、并行计算策略、运行时调度优化及分布式部署等方面,持续提升推理效率并降低资源开销。
职位要求:
1.具备扎实的系统开发能力,熟练掌握C++、Python编程语言。拥有良好的编码规范,理解常用软件设计模式,具备系统级工程实现与性能剖析能力。
2.掌握主流模型压缩与快速解码技术,能够准确评估性能与精度之间的平衡关系。
3.熟悉GPU架构及CUDA开发,有使用CUTLASS、Triton等工具进行高性能算子开发的经验,具备较强的性能调优实战能力。
4.理解常见并行方式(TP/PP/DP/EP/SP等)的原理及其应用场景,能针对不同模型结构进行合理的并行策略选择与性能分析。
5.拥有分布式系统设计与开发经验,可构建高吞吐、低延迟、易扩展且稳定可靠的在线推理服务架构。
6.深入理解大语言模型的工作负载特征与实际应用需求,具备多维度性能优化经验,能从系统和算法层面协同思考问题。关注前沿动态,熟悉主流开源项目及相关技术生态。
除技术能力外,我们期待你具备以下素质:
1.学习能力强,对新兴技术保持敏锐洞察,乐于挑战未知领域。
2.目标驱动,积极进取,善于攻坚复杂问题。
3.具备良好的协作意识与团队沟通能力。
工作内容:
打造行业领先的大语言模型推理底层架构,围绕量化压缩、高效解码、算子加速、并行计算策略、运行时调度优化及分布式部署等方面,持续提升推理效率并降低资源开销。
职位要求:
1.具备扎实的系统开发能力,熟练掌握C++、Python编程语言。拥有良好的编码规范,理解常用软件设计模式,具备系统级工程实现与性能剖析能力。
2.掌握主流模型压缩与快速解码技术,能够准确评估性能与精度之间的平衡关系。
3.熟悉GPU架构及CUDA开发,有使用CUTLASS、Triton等工具进行高性能算子开发的经验,具备较强的性能调优实战能力。
4.理解常见并行方式(TP/PP/DP/EP/SP等)的原理及其应用场景,能针对不同模型结构进行合理的并行策略选择与性能分析。
5.拥有分布式系统设计与开发经验,可构建高吞吐、低延迟、易扩展且稳定可靠的在线推理服务架构。
6.深入理解大语言模型的工作负载特征与实际应用需求,具备多维度性能优化经验,能从系统和算法层面协同思考问题。关注前沿动态,熟悉主流开源项目及相关技术生态。
除技术能力外,我们期待你具备以下素质:
1.学习能力强,对新兴技术保持敏锐洞察,乐于挑战未知领域。
2.目标驱动,积极进取,善于攻坚复杂问题。
3.具备良好的协作意识与团队沟通能力。
2026-06-04 14:33
IP属地:浙江杭州
职位福利
本科1-3年C/C++推理深度学习算法工程化经验其他大模型分布式模型加速/性能优化Python

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI工程师(AI软件开发/机器学习/计算机视觉/自然语言处理)
1.6-3万元/月
机器学习经验不限本科计算机软件人工智能国内院校优先自然语言处理算法推荐算法图像算法多模态算法C/C++PythonJava深度学习大模型算法强化学习算法工程化经验
杭州 滨江区
机器学习算法开发工程师
3-6万元/月
机器学习3-5年本科发表算法相关优秀论文C/C++搜索算法大模型算法算法工程化经验强化学习参加算法相关竞赛/获奖大数据处理工具(Spark/Hadoop/Hive)推荐算法PythonSQL
杭州 西湖区
AI大数据储备人才
7000-12000元/月
机器学习经验不限硕士Java大模型算法自然语言处理算法参加算法相关竞赛/获奖大数据处理工具(Spark/Hadoop/Hive)Python
杭州 余杭区










