职位详情
熟悉Post-Training流程,深入掌握强化学习领域核心技术,涵盖RM、PPO、DPO、GRPO等主流算法。
具备大规模语言模型训练框架的开发经验,熟练使用pytorch、megatron等工具链。
具备强化学习相关框架的构建与优化能力,如openRLHF、verl等系统。
工作职责
1. 参与公司内部 post-training 技术框架的研发,聚焦大模型与强化学习结合方向,主导架构设计与技术路径规划,提升系统的可扩展性、稳定性和运行效率。
2. 持续优化训练性能,包括加速训练过程、降低显存消耗等,减少整体训练开销,为大模型强化学习任务提供高效技术支持。
3. 联动业务团队,推动大模型能力在实际场景中的应用,依据具体需求定制化训练策略,并完成模型效果的评估与验证。
4. 跟踪技术发展趋势,将前沿研究成果融入现有框架与模型体系,探索新算法和方法,促进技术迭代与创新。
任职要求
1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。
2. 熟悉模型后训练全流程,对强化学习领域有深入理解,掌握RM、PPO、DPO、GRPO等典型算法原理与实现。
3. 具备大模型训练系统开发能力,熟练运用pytorch、megatron等主流框架。
4. 具备强化学习工程框架开发经验,熟悉openRLHF、verl等系统的使用与优化。
5. 拥有扎实的C++/Python编程功底,精通数据结构与常用算法,熟练使用编译、调试及性能分析工具,具备并行计算(CUDA/Triton等)经验者优先。
具备大规模语言模型训练框架的开发经验,熟练使用pytorch、megatron等工具链。
具备强化学习相关框架的构建与优化能力,如openRLHF、verl等系统。
工作职责
1. 参与公司内部 post-training 技术框架的研发,聚焦大模型与强化学习结合方向,主导架构设计与技术路径规划,提升系统的可扩展性、稳定性和运行效率。
2. 持续优化训练性能,包括加速训练过程、降低显存消耗等,减少整体训练开销,为大模型强化学习任务提供高效技术支持。
3. 联动业务团队,推动大模型能力在实际场景中的应用,依据具体需求定制化训练策略,并完成模型效果的评估与验证。
4. 跟踪技术发展趋势,将前沿研究成果融入现有框架与模型体系,探索新算法和方法,促进技术迭代与创新。
任职要求
1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。
2. 熟悉模型后训练全流程,对强化学习领域有深入理解,掌握RM、PPO、DPO、GRPO等典型算法原理与实现。
3. 具备大模型训练系统开发能力,熟练运用pytorch、megatron等主流框架。
4. 具备强化学习工程框架开发经验,熟悉openRLHF、verl等系统的使用与优化。
5. 拥有扎实的C++/Python编程功底,精通数据结构与常用算法,熟练使用编译、调试及性能分析工具,具备并行计算(CUDA/Triton等)经验者优先。
2026-02-13 14:10
IP属地:北京
职位福利
本科及以上3-5年C/C++JavaAgentpost+trainFine-Tuning分布式训练大模型算法多模态算法算法工程化经验AI微调Python

上海阿蒲管理咨询事务所
· 1人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI算法研发工程师
2-3万元/月
算法工程师1年以下硕士及以上C/C++phm系统机器学习大模型算法多模态算法算法工程化经验无人机健康管理MATLABPython
北京 海淀区

先生 · 北航无人机公司3日内活跃
算法工程师(MJ007227)
2.5-4万元/月
算法工程师3-5年本科及以上机器学习运筹优化算法Scala大模型算法算法工程化经验MATLAB推荐算法模型加速/性能优化
北京 海淀区

吴女士 · 去哪儿网昨日活跃
计算机视觉算法实习生
200-400元/天
兼职算法工程师本科及以上Python深度学习机器学习大模型算法强化学习算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖优秀开源项目经历
北京 海淀区

许先生 · 安阔科技(杭州)有限公司3日内活跃
飞行控制算法设计师
2.5-4.5万元/月
算法工程师3-5年硕士及以上控制律设计、频域分析无人机航路规划规控算法倾转旋翼无人机控制算法工程化经验其他MATLABPID+飞行器
北京 海淀区

先生 · 北航无人机公司3日内活跃
AI算法工程师(需现场派驻)
1.5-2.5万元/月
算法工程师1-3年本科及以上搜索算法机器学习深度学习大模型算法自然语言处理算法大数据处理框架(Spark/Hadoop/Hive)算法工程化经验PythonSQL
北京 海淀区

文女士 · 中软国际昨日活跃






