搜索
登录注册

职位详情

1、负责大模型Post-training流程的优化与研发工作,涵盖SFT、RL训练等相关技术环节;
2、深入探索大模型强化学习方向的关键技术,聚焦推理能力Reasoning、智能体Agent等领域的创新突破,持续提升模型在测试与实际应用中的表现;
3、跟踪并研究前沿AGI相关新技术,复现最新学术成果,并推动其在业务场景中的落地与效果转化。

职位要求
1、具有大模型后训练、Reasoning、Agent等方向的技术实践经验;
2、具备较强的自我驱动力与分析能力,良好的沟通与团队协作意识。
2026-05-16 14:21
IP属地:北京

职位福利

本科3-5年SFT++DPO++RLHF++RFT大模型算法后训练强化学习其他RL参加算法相关竞赛/获奖post+training模型加速/性能优化Python
企业发布信息图
上海阿蒲管理咨询事务所
0-20人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

算法
3-3.5万元/月
算法工程师5-10年本科
北京 海淀区
驻场算法
3.5-6万元/月
算法工程师5-10年本科AGENTRAG多模态算法
北京 海淀区
初级AIGC算法工程师
8000-12000元/月
算法工程师经验不限本科深度学习机器学习多模态算法自然语言处理机器视觉PyTorchTensorFlowPythonAIGC算法研发扩散模型落地前沿技术调研
北京 海淀区
初级感知算法开发工程师
8000-12000元/月
算法工程师经验不限本科深度学习机器视觉TensorFlowPyTorchPythonC++激光雷达感知端侧模型部署多模态数据融合
北京 海淀区
三维图形算法工程师
4-6万元/月
算法工程师3-5年硕士机器视觉
北京 海淀区
增长算法工程师/双休/算法驱动增长/深耕核心业务
2.5-4.5万元/月
算法工程师3-5年本科
北京 海淀区 中关村
LM应用工程师(算法方向)
2-2.3万元/月
算法工程师3-5年本科深度学习大模型算法大数据处理框架(Spark/Hadoop/Hive)算法工程化经验SLAM算法
北京 海淀区
申先生 · 远浪5日内活跃
大模型微调后训练工程师
2.5-5万元/月
算法工程师3-5年本科SFT++DPO++RLHF++RFT大模型算法后训练强化学习其他RL参加算法相关竞赛/获奖post+training模型加速/性能优化Python
北京 海淀区
AI智能体开发工程师
2-4万元/月
算法工程师1-3年硕士深度学习大模型算法自然语言处理算法算法工程化经验并行计算优秀开源项目经历Python
北京 海淀区
人工智能算法研发工程师
2-3万元/月
算法工程师3-5年硕士图像算法多模态算法大模型算法
北京 海淀区