职位详情
熟悉模型后训练全流程,深入掌握强化学习相关技术,涵盖RM、PPO、DPO、GRPO等主流算法。
具备大规模语言模型训练框架的开发经验,熟练使用pytorch、megatron等工具链。
具备强化学习系统框架开发能力,有openRLHF、verl等框架的实际项目经历。
工作职责
1. 参与后训练系统框架的研发工作,聚焦大模型与强化学习融合方向,负责架构设计与技术路径规划,提升系统的可扩展性、稳定性和运行效率。
2. 持续优化训练性能,包括加速训练过程、降低显存消耗等,控制整体训练开销,为大模型强化学习任务提供高效技术支持。
3. 与业务团队紧密协作,推动大模型能力在实际场景中的应用落地,按需定制训练策略并完成模型效果评估与验证。
4. 跟踪领域前沿动态,将具有应用价值的新技术引入公司现有框架与模型体系,探索先进算法方案,促进技术迭代升级。
任职要求
1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。
2. 熟悉模型后训练流程,深入理解强化学习领域,掌握RM、PPO、DPO、GRPO等典型算法原理与实现方式。
3. 具备大模型训练框架开发经验,熟练运用pytorch、megatron等主流框架。
4. 具备强化学习框架开发背景,熟悉openRLHF、verl等系统的开发与调优。
5. 具备扎实的C++/Python工程能力,熟练掌握数据结构与常用算法,精通编译、调试及性能分析工具,具备并行计算(CUDA/Triton等)经验者优先。
具备大规模语言模型训练框架的开发经验,熟练使用pytorch、megatron等工具链。
具备强化学习系统框架开发能力,有openRLHF、verl等框架的实际项目经历。
工作职责
1. 参与后训练系统框架的研发工作,聚焦大模型与强化学习融合方向,负责架构设计与技术路径规划,提升系统的可扩展性、稳定性和运行效率。
2. 持续优化训练性能,包括加速训练过程、降低显存消耗等,控制整体训练开销,为大模型强化学习任务提供高效技术支持。
3. 与业务团队紧密协作,推动大模型能力在实际场景中的应用落地,按需定制训练策略并完成模型效果评估与验证。
4. 跟踪领域前沿动态,将具有应用价值的新技术引入公司现有框架与模型体系,探索先进算法方案,促进技术迭代升级。
任职要求
1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。
2. 熟悉模型后训练流程,深入理解强化学习领域,掌握RM、PPO、DPO、GRPO等典型算法原理与实现方式。
3. 具备大模型训练框架开发经验,熟练运用pytorch、megatron等主流框架。
4. 具备强化学习框架开发背景,熟悉openRLHF、verl等系统的开发与调优。
5. 具备扎实的C++/Python工程能力,熟练掌握数据结构与常用算法,精通编译、调试及性能分析工具,具备并行计算(CUDA/Triton等)经验者优先。
2026-05-08 12:51
IP属地:北京
职位福利
本科5-10年C++显存优化分布式经验吞吐量提升并行计算分布式Python

上海阿蒲管理咨询事务所
0-20人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
C++ 智能体开发工程师
1.8-2.3万元/月
C/C++1-3年本科Semantic KernelC++AutoGenLangchainLanggraph大模型智能体Python
北京 海淀区

吕先生 · 联想利泰5日内活跃











