职位详情
职位描述:
1、负责强化学习(RL)核心算法的设计与工程实现,打造高效智能决策模型,支撑软件系统全流程(需求分析-架构设计-部署运维)的智能化升级;
2、推进深度强化学习(DRL)关键技术突破,聚焦大语言模型(LLM)与多智能体强化学习(MARL)的协同创新,加速其在能源微电网、工业自动化等复杂场景的大规模落地应用。
职位要求:
硬性条件:
1、具备3年以上强化学习实际项目经验,熟练掌握DQN、PPO、SAC等主流算法,有大型RL系统上线部署实践;
2、精通PyTorch或TensorFlow框架,具备扎实的工程开发能力;
3、在ICML/NeurIPS/AAAI等顶级会议发表过相关论文者优先考虑。
加分项:
1、拥有大语言模型(LLM)调优或RLHF(基于人类反馈的强化学习)项目实操经验;
2、了解多智能体博弈机制与联邦学习技术,具备电力调度、机器人控制等领域项目背景;
3、数学功底深厚,熟悉随机过程、博弈论及最优控制理论。
软性素质:
1、具备技术敏锐度,能快速跟进并复现前沿研究成果,推动算法迭代优化;
2、目标驱动型思维,善于从实际业务问题出发反向设计技术解决方案。
1、负责强化学习(RL)核心算法的设计与工程实现,打造高效智能决策模型,支撑软件系统全流程(需求分析-架构设计-部署运维)的智能化升级;
2、推进深度强化学习(DRL)关键技术突破,聚焦大语言模型(LLM)与多智能体强化学习(MARL)的协同创新,加速其在能源微电网、工业自动化等复杂场景的大规模落地应用。
职位要求:
硬性条件:
1、具备3年以上强化学习实际项目经验,熟练掌握DQN、PPO、SAC等主流算法,有大型RL系统上线部署实践;
2、精通PyTorch或TensorFlow框架,具备扎实的工程开发能力;
3、在ICML/NeurIPS/AAAI等顶级会议发表过相关论文者优先考虑。
加分项:
1、拥有大语言模型(LLM)调优或RLHF(基于人类反馈的强化学习)项目实操经验;
2、了解多智能体博弈机制与联邦学习技术,具备电力调度、机器人控制等领域项目背景;
3、数学功底深厚,熟悉随机过程、博弈论及最优控制理论。
软性素质:
1、具备技术敏锐度,能快速跟进并复现前沿研究成果,推动算法迭代优化;
2、目标驱动型思维,善于从实际业务问题出发反向设计技术解决方案。
2026-05-15 13:23
IP属地:广东深圳
职位福利
本科3-5年PyTorch大数据处理框架(Spark/Hadoop/H

深圳市中电电力技术股份有限公司
未融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
运控算法实习生
200-400元/天
兼职算法工程师经验不限硕士图像算法SLAM算法C/C++Python深度学习发表算法相关优秀论文优秀开源项目经历
深圳 南山区

付女士 · 深圳市光之跃迁科技有限公司3日内活跃
点云处理算法工程师(扫描)(J10452)
2.5-4万元/月
算法工程师1-3年硕士C/C++图像算法点云处理点云融合TSDF点云去噪纹理贴图强化学习融合感知算法参加算法相关竞赛/获奖
深圳 南山区

先生 · 奥比中光5日内活跃








