职位详情
岗位职责:
1.开展深度强化学习控制算法的研究与开发,应用于机器人行走运动对抗、飞行器控制等场景下的自主策略学习。
2.构建、训练并优化强化学习智能体,涵盖模仿学习、迁移学习、强化学习及自监督学习等方法,提升智能体在感知与决策中的自主性、学习效率与泛化性能。
3.融合仿真平台与真实硬件系统,持续优化机器人或智能体的控制策略与算法表现。
4.改进强化学习训练架构,加快策略收敛速度,增强模型稳定性与可解释性。
5.参与团队技术研讨,编写相关技术文档,并推进研究成果向实际产品的转化应用。
岗位要求:
1.教育背景:计算机科学、人工智能、机器学习、机器人学或相关专业博士学历,优先考虑国内外重点高校毕业者。
2.研究经历:在深度强化学习、机器人/飞行器控制、模仿学习或多智能体协同学习方向有扎实研究基础,曾在NeurlPS、CORL等顶级会议或期刊发表过相关论文。
3.编程技能:熟练掌握Python,精通PyTorch等主流深度学习框架,具备强化学习常用库的使用经验。
4.理论基础:深入理解强化学习核心理论(如DQN、PPO),熟悉策略梯度、模型预测控制等相关技术。
5.仿真与实机经验:具备在仿真环境中开展算法开发与训练的能力,或拥有真实机器人系统上的调试与部署经验。
6.工程实现:了解高性能计算机制,掌握并行化与分布式训练技术,具备大规模强化学习项目落地实践经验。
7.项目背景:在机器人、具身智能、自动驾驶、飞行器等领域参与过开源项目者优先考虑。
8.创新意识:持续关注强化学习与机器人领域的前沿进展,具备将最新研究成果融入实际应用的能力
1.开展深度强化学习控制算法的研究与开发,应用于机器人行走运动对抗、飞行器控制等场景下的自主策略学习。
2.构建、训练并优化强化学习智能体,涵盖模仿学习、迁移学习、强化学习及自监督学习等方法,提升智能体在感知与决策中的自主性、学习效率与泛化性能。
3.融合仿真平台与真实硬件系统,持续优化机器人或智能体的控制策略与算法表现。
4.改进强化学习训练架构,加快策略收敛速度,增强模型稳定性与可解释性。
5.参与团队技术研讨,编写相关技术文档,并推进研究成果向实际产品的转化应用。
岗位要求:
1.教育背景:计算机科学、人工智能、机器学习、机器人学或相关专业博士学历,优先考虑国内外重点高校毕业者。
2.研究经历:在深度强化学习、机器人/飞行器控制、模仿学习或多智能体协同学习方向有扎实研究基础,曾在NeurlPS、CORL等顶级会议或期刊发表过相关论文。
3.编程技能:熟练掌握Python,精通PyTorch等主流深度学习框架,具备强化学习常用库的使用经验。
4.理论基础:深入理解强化学习核心理论(如DQN、PPO),熟悉策略梯度、模型预测控制等相关技术。
5.仿真与实机经验:具备在仿真环境中开展算法开发与训练的能力,或拥有真实机器人系统上的调试与部署经验。
6.工程实现:了解高性能计算机制,掌握并行化与分布式训练技术,具备大规模强化学习项目落地实践经验。
7.项目背景:在机器人、具身智能、自动驾驶、飞行器等领域参与过开源项目者优先考虑。
8.创新意识:持续关注强化学习与机器人领域的前沿进展,具备将最新研究成果融入实际应用的能力
2026-06-29 14:26
IP属地:浙江宁波
职位福利
博士1-3年规控算法自然语言处理算法多模态算法算法工程化经验MA

宁波欧熠乐科技有限公司
A轮 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
深度强化学习控制算法工程师
3-5万元/月
深度学习1-3年博士规控算法自然语言处理算法多模态算法算法工程化经验MATLAB优秀开源项目经历发表算法相关优秀论文C/C++强化学习参加算法相关竞赛/获奖大数据处理工具(Spark/Hadoop/H
宁波 海曙区
AI平台高级工程师
2.5-4.5万元/月
深度学习5-10年硕士C/C++分布式训练K8s大模型算法自然语言处理算法多模态算法国内院校优先Ai推理模型加速/性能优化Python
杭州 滨江区
AI平台高级工程师
2.5-4.5万元/月
深度学习5-10年硕士C/C++分布式训练K8s大模型算法自然语言处理算法多模态算法国内院校优先Ai推理模型加速/性能优化Python
杭州 滨江区









