职位详情
职位描述:
我们是阿里巴巴离线推理团队,负责大规模多模态数据处理pipeline,支持非LLM的模型结构定制、异构卡型适配和推理加速。与千问、百炼等团队合作,以软件和SAAS的方式,为淘天、AIDC、高德、优酷、闲鱼等多个集团业务部门提供强有力的技术支撑和底层服务能力。
1. 主导或核心参与基于编译技术的算子平台化优化方案,利用Triton、TileLang、JAX/MLIR等技术栈,支持模型结构的定制与优化,缩短新卡型或新模型的适配周期。
2. 使用专业的Profiling工具,对模型在异构硬件上的端到端性能进行分析,精准定位Kernel执行、数据搬运、通信等环节的瓶颈,并提出体系化的优化方案。
3. 针对特定异构芯片(如华为昇腾、AMD MI系列等),深入分析其指令集、存储层级(HBM/Cache)和计算单元特性,使用原生语言手写和优化核心算子,实现极致性能。
职位要求:
1. 计算机、电子工程或相关专业本科及以上学历,对计算机体系结构有深刻理解。
2. 有GPU/NPU/XPU高性能计算优化经验,精通至少一种异构计算平台及编程模型(如CUDA, ROCm, OpenCL, SYCL, CANN等),有针对AMD、华为、Intel等特定AI芯片的深度性能调优经验的可加分。
3. 熟悉现代AI模型中关键算子的计算原理和优化方法,有MLIR/LLVM相关开发经验,或有丰富的Triton/TVM算子开发与优化经验,可加分。
4. 具备极强的技术钻研精神和解决复杂问题的能力,能够适应快速迭代的技术环境。
我们是阿里巴巴离线推理团队,负责大规模多模态数据处理pipeline,支持非LLM的模型结构定制、异构卡型适配和推理加速。与千问、百炼等团队合作,以软件和SAAS的方式,为淘天、AIDC、高德、优酷、闲鱼等多个集团业务部门提供强有力的技术支撑和底层服务能力。
1. 主导或核心参与基于编译技术的算子平台化优化方案,利用Triton、TileLang、JAX/MLIR等技术栈,支持模型结构的定制与优化,缩短新卡型或新模型的适配周期。
2. 使用专业的Profiling工具,对模型在异构硬件上的端到端性能进行分析,精准定位Kernel执行、数据搬运、通信等环节的瓶颈,并提出体系化的优化方案。
3. 针对特定异构芯片(如华为昇腾、AMD MI系列等),深入分析其指令集、存储层级(HBM/Cache)和计算单元特性,使用原生语言手写和优化核心算子,实现极致性能。
职位要求:
1. 计算机、电子工程或相关专业本科及以上学历,对计算机体系结构有深刻理解。
2. 有GPU/NPU/XPU高性能计算优化经验,精通至少一种异构计算平台及编程模型(如CUDA, ROCm, OpenCL, SYCL, CANN等),有针对AMD、华为、Intel等特定AI芯片的深度性能调优经验的可加分。
3. 熟悉现代AI模型中关键算子的计算原理和优化方法,有MLIR/LLVM相关开发经验,或有丰富的Triton/TVM算子开发与优化经验,可加分。
4. 具备极强的技术钻研精神和解决复杂问题的能力,能够适应快速迭代的技术环境。
2026-06-25 14:04
IP属地:浙江
职位福利
本科3-5年

淘宝(中国)软件有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










