搜索
登录注册

职位详情

职位描述
● 承担PAI平台深度学习框架的开发工作,涵盖MoE模型大规模训练架构、多模态训练体系、RLHF训练流程等方向,服务于通义实验室、阿里集团等多个业务场景;参与基模型Pretrain、SFT等各阶段训练任务的性能调优;
● 专注于提升各类模型训练负载在不同阶段的极限吞吐能力,系统性分析耗时瓶颈并制定针对性优化方案,手段覆盖算子层面改进、通信机制增强、分布式策略调整等技术路径;
● 主导超大规模训练任务稳定性的架构设计,综合运用多种技术提升训练有效吞吐,建设高效的故障识别与自动恢复机制,保障大规模训练过程的流畅性与可靠性;
● 参与训练框架对多种硬件后端的适配与性能优化工作。

职位要求
● 具备扎实的工程实现能力,良好的编码规范,熟练掌握Python/C++及常见设计模式,拥有复杂系统的架构设计、开发与调试经验;
● 理解深度学习基本理论,熟悉Transformer结构,了解主流大语言模型、多模态模型的技术特性;
● 精通PyTorch等相关框架,深入理解Megatron、DeepSpeed、JAX等训练框架的设计差异与核心技术细节;
● 具有良好的沟通表达能力和团队协作精神,具备快速获取新知识的能力和持续攻坚技术难题的韧性;
● 掌握计算机体系结构基础,具备异构计算优化(GPGPU/x86/ARM等)、高性能网络通信调优、分布式训练策略优化等方面的实践经验;
2026-06-19 13:04
IP属地:北京

职位福利

本科3-5年大模型算法强化学习多模态算法PythonC/C++训练工程研发
企业发布信息图
阿里云计算有限公司
不需要融资 · 10000人以上
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

机器学习训练框架研发工程师/专家-北上杭
3.5-6.5万元/月
高性能计算工程师3-5年硕士深度学习强化学习大模型算法自然语言处理算法多模态算法模型加速/性能优化运筹优化并行计算
北京 朝阳区
异构计算软硬件融合高级开发-深圳/杭州
3-6万元/月
高性能计算工程师3-5年本科sglangvLLMQwenDeepSeekcutlassTritionTP/EPGPU
北京 朝阳区
阿里云智能-深度学习训练系统研发专家
2.8-5.5万元/月
高性能计算工程师3-5年本科深度学习大模型算法自然语言处理算法多模态算法C/C++Python分布式训练算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖
北京 朝阳区
阿里云智能-深度学习推理系统研发专家
2.8-5.5万元/月
高性能计算工程师3-5年本科深度学习大模型算法模型加速/性能优化自然语言处理算法多模态算法C/C++Python算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖
北京 朝阳区
深度学习训练系统研发专家-北京,杭州
4-7万元/月
高性能计算工程师经验不限本科机器学习大模型算法模型加速/性能优化多模态算法C/C++Python分布式训练
北京 朝阳区
阿里云智能-深度学习训练架构研发专家
3-6万元/月
高性能计算工程师3-5年本科机器学习自然语言处理算法Python分布式训练算法工程化经验
北京 朝阳区
深度学习训练系统研发专家-北京,杭州
3.5-6.5万元/月
高性能计算工程师3-5年本科机器学习大模型算法模型加速/性能优化C/C++PythonJavaGolang
北京 朝阳区
高性能计算开发工程师
4-6万元/月
高性能计算工程师3-5年硕士多线程网络编程多进程LinuxCUDAARM开发
北京 西城区
小米澎湃OS-编译器
7-10万元/月
高性能计算工程师5-10年硕士LLVMART编译器
北京 海淀区