职位详情
大模型推理系统工程师-AI Infra-杭州/北京
工作职责:
本岗位隶属于阿里巴巴集团智能引擎事业部,聚焦生成式AI方向(以图像生成和大语言模型为主),承担内部产品及训练推理服务平台的构建与运维,为淘宝、天猫、聚划算、优酷、闲鱼等多条业务线提供坚实的技术底座与底层能力支持。核心工作包括:
1. 主导高性能大模型推理引擎的设计与实现;综合运用流量调度、并行计算、缓存机制等手段,打造高效的大规模分布式模型服务架构。
2. 整合前沿算法工程方法,采用量化、动态剪枝等有损压缩技术,实现模型推理的极致加速与资源成本优化。
3. 联合数据、算法与工程团队,共建AI基础设施平台,为生成式AI场景提供全链路技术支持,助力业务创新落地。
任职要求:
1. 熟悉AI算法与AI系统工程体系(如迭代开发模式、端到端架构设计、工程框架搭建、性能建模分析等),至少精通一种主流深度学习框架。
2. 具备异构计算与软硬件协同优化认知,具备实际性能调优经验;掌握cutlass或triton编译技术者更佳。
3. 了解大模型相关算法原理,包括Transformer、MoE、MLA、Diffusion等典型结构。
4. 具备大规模分布式系统研发与调优经验者优先考虑。
5. 具备良好沟通协作能力,动手能力强,具备持续学习意愿与应对挑战的积极性。
工作职责:
本岗位隶属于阿里巴巴集团智能引擎事业部,聚焦生成式AI方向(以图像生成和大语言模型为主),承担内部产品及训练推理服务平台的构建与运维,为淘宝、天猫、聚划算、优酷、闲鱼等多条业务线提供坚实的技术底座与底层能力支持。核心工作包括:
1. 主导高性能大模型推理引擎的设计与实现;综合运用流量调度、并行计算、缓存机制等手段,打造高效的大规模分布式模型服务架构。
2. 整合前沿算法工程方法,采用量化、动态剪枝等有损压缩技术,实现模型推理的极致加速与资源成本优化。
3. 联合数据、算法与工程团队,共建AI基础设施平台,为生成式AI场景提供全链路技术支持,助力业务创新落地。
任职要求:
1. 熟悉AI算法与AI系统工程体系(如迭代开发模式、端到端架构设计、工程框架搭建、性能建模分析等),至少精通一种主流深度学习框架。
2. 具备异构计算与软硬件协同优化认知,具备实际性能调优经验;掌握cutlass或triton编译技术者更佳。
3. 了解大模型相关算法原理,包括Transformer、MoE、MLA、Diffusion等典型结构。
4. 具备大规模分布式系统研发与调优经验者优先考虑。
5. 具备良好沟通协作能力,动手能力强,具备持续学习意愿与应对挑战的积极性。
2026-05-21 13:54
IP属地:浙江杭州
职位福利
硕士3-5年推理引擎开发ai工程性能优化Ai infra分布式系统开发ai算法大模型推理异构计算

杭州阿里云飞天信息技术有限公司
10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
阿里云智能-深度学习训练系统研发专家
2.8-5.5万元/月
高性能计算工程师3-5年本科机器学习大模型算法自然语言处理算法模型加速/性能优化多模态算法C/C++Python分布式训练算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖
杭州 西湖区

方先生 · 阿里云5日内活跃
深度学习训练系统开发专家
4-7万元/月
高性能计算工程师经验不限本科C/C++机器学习分布式训练大模型算法多模态算法强化学习并行计算模型加速/性能优化Python
杭州 西湖区

方先生 · 阿里云5日内活跃
深度学习推理系统开发专家
4-7万元/月
高性能计算工程师经验不限本科深度学习大模型算法模型加速/性能优化C/C++Python大数据处理工具(Spark/Hadoop/Hive)并行计算分布式训练
杭州 西湖区

张先生 · 阿里云5日内活跃
阿里云智能-深度学习推理系统研发专家
2.8-5.5万元/月
高性能计算工程师3-5年本科机器学习大模型算法模型加速/性能优化多模态算法C/C++Python分布式训练算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖优秀开源项目经历
杭州 西湖区

张先生 · 阿里云5日内活跃



