职位详情
1、负责大模型Post-training流程的优化与研发工作,涵盖SFT、RL训练等关键技术环节;
2、深入探索大模型强化学习相关方法,聚焦推理能力Reasoning、智能体Agent等方向的技术创新,持续提升模型在测试与实际应用中的表现;
3、跟踪并研究前沿AGI相关新技术,复现最新学术成果,并推动其在业务场景中的落地与验证。
职位要求
1、具有大模型后训练、Reasoning、Agent等方向的技术实践与项目经验;
2、具备较强的自我驱动力与问题分析能力,善于团队沟通与协作。
2、深入探索大模型强化学习相关方法,聚焦推理能力Reasoning、智能体Agent等方向的技术创新,持续提升模型在测试与实际应用中的表现;
3、跟踪并研究前沿AGI相关新技术,复现最新学术成果,并推动其在业务场景中的落地与验证。
职位要求
1、具有大模型后训练、Reasoning、Agent等方向的技术实践与项目经验;
2、具备较强的自我驱动力与问题分析能力,善于团队沟通与协作。
2026-06-27 12:46
IP属地:北京
职位福利
本科3-5年SFT++DPO++RLHF++RFT大模型算法后训练强化学习其他RL参加算法相关竞赛/获奖post+training模型加速/性能优化Python

上海阿蒲管理咨询事务所
0-20人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
算法方向实习生
200-400元/天
算法工程师经验不限硕士发表算法相关优秀论文大模型算法自然语言处理算法多模态算法算法工程化经验参加算法相关竞赛/获奖MATLAB优秀开源项目经历模型加速/性能优化Python
北京 海淀区










