职位详情
岗位职责:
1. 开展深度强化学习控制算法的研究与开发,应用于机器人行走运动对抗、飞行器控制等场景中的自主策略学习任务。
2. 构建并优化强化学习智能体,涵盖模仿学习、迁移学习、强化学习及自监督学习等方法,提升智能体在感知与决策上的自主性、学习效率与泛化性能。
3. 在仿真平台与真实硬件系统中协同开展测试与迭代,持续改进机器人或智能体的控制策略与算法表现。
4. 改进强化学习训练架构,加快策略收敛速度,增强模型稳定性与可解释性。
5. 参与团队技术研讨,编写相关技术文档,并推进研究成果向实际产品的转化与应用。
岗位要求:
1. 教育背景:计算机科学、人工智能、机器学习、机器人学或相关专业博士学历,优先考虑国内外高水平院校毕业者。
2. 研究能力:在深度强化学习、机器人/飞行器控制、模仿学习或多智能体系统等领域具有扎实研究基础,曾在NeurlPS、CORL等顶级会议或期刊发表过论文。
3. 编程技能:熟练掌握Python,精通PyTorch等主流深度学习框架,了解常用强化学习工具库。
4. 理论基础:深入理解强化学习核心理论(如DQN、PPO),熟悉策略梯度、模型学习等相关技术方法。
5. 实践经验:具备在仿真环境中进行算法开发与训练的经历,或拥有真实机器人系统的调试与部署经验。
6. 工程素养:了解高性能计算机制,掌握并行化与分布式训练技术,具备大规模强化学习项目落地实施经验。
7. 项目经历:有机器人、具身智能、自动驾驶、飞行器等相关方向开源项目经验者优先考虑。
8. 创新意识:持续关注强化学习与机器人领域的前沿进展,具备将先进研究成果融入实际工程问题的能力。
1. 开展深度强化学习控制算法的研究与开发,应用于机器人行走运动对抗、飞行器控制等场景中的自主策略学习任务。
2. 构建并优化强化学习智能体,涵盖模仿学习、迁移学习、强化学习及自监督学习等方法,提升智能体在感知与决策上的自主性、学习效率与泛化性能。
3. 在仿真平台与真实硬件系统中协同开展测试与迭代,持续改进机器人或智能体的控制策略与算法表现。
4. 改进强化学习训练架构,加快策略收敛速度,增强模型稳定性与可解释性。
5. 参与团队技术研讨,编写相关技术文档,并推进研究成果向实际产品的转化与应用。
岗位要求:
1. 教育背景:计算机科学、人工智能、机器学习、机器人学或相关专业博士学历,优先考虑国内外高水平院校毕业者。
2. 研究能力:在深度强化学习、机器人/飞行器控制、模仿学习或多智能体系统等领域具有扎实研究基础,曾在NeurlPS、CORL等顶级会议或期刊发表过论文。
3. 编程技能:熟练掌握Python,精通PyTorch等主流深度学习框架,了解常用强化学习工具库。
4. 理论基础:深入理解强化学习核心理论(如DQN、PPO),熟悉策略梯度、模型学习等相关技术方法。
5. 实践经验:具备在仿真环境中进行算法开发与训练的经历,或拥有真实机器人系统的调试与部署经验。
6. 工程素养:了解高性能计算机制,掌握并行化与分布式训练技术,具备大规模强化学习项目落地实施经验。
7. 项目经历:有机器人、具身智能、自动驾驶、飞行器等相关方向开源项目经验者优先考虑。
8. 创新意识:持续关注强化学习与机器人领域的前沿进展,具备将先进研究成果融入实际工程问题的能力。
2026-07-01 12:47
IP属地:浙江宁波
职位福利
博士1-3年规控算法自然语言处理算法多模态算法算法工程化经验MATLAB优秀开源项目经历发表算法相关优秀论文C/C++强化学习参加算法相关竞赛/获奖大数据处理工具(Spark/Hadoop/H

宁波欧熠乐科技有限公司
A轮 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI平台高级工程师
2.5-4.5万元/月
深度学习5-10年硕士C/C++分布式训练K8s大模型算法自然语言处理算法多模态算法国内院校优先Ai推理模型加速/性能优化Python
杭州 滨江区
AI平台高级工程师
2.5-4.5万元/月
深度学习5-10年硕士C/C++分布式训练K8s大模型算法自然语言处理算法多模态算法国内院校优先Ai推理模型加速/性能优化Python
杭州 滨江区









