强化学习算法工程师-深圳

1.6-2.5万元/月

深圳·南山区

先生

已实名

企业认证

深圳市中电电力技术股份有限公司

职位详情

算法工程师

职位描述：
1、负责强化学习（RL）核心算法的设计与工程实现，打造高效智能决策模型，支撑软件系统全流程（需求分析-架构设计-部署运维）的智能化升级；
2、推进深度强化学习（DRL）关键技术突破，聚焦大语言模型（LLM）与多智能体强化学习（MARL）的协同创新，加速其在能源微电网、工业自动化等复杂场景的大规模落地应用。

职位要求：
硬性条件：
1、具备3年以上强化学习实际项目经验，熟练掌握DQN、PPO、SAC等主流算法，有大型RL系统上线部署实践；
2、精通PyTorch或TensorFlow框架，具备扎实的工程开发能力；
3、在ICML/NeurIPS/AAAI等顶级会议发表过相关论文者优先考虑。

加分项：
1、拥有大语言模型（LLM）调优或RLHF（基于人类反馈的强化学习）项目实操经验；
2、了解多智能体博弈机制与联邦学习技术，具备电力调度、机器人控制等领域项目背景；
3、数学功底深厚，熟悉随机过程、博弈论及最优控制理论。

软性素质：
1、具备技术敏锐度，能快速跟进并复现前沿研究成果，推动算法迭代优化；
2、目标驱动型思维，善于从实际业务问题出发反向设计技术解决方案。

2026-06-27 12:14

IP属地：广东深圳

职位福利

本科3-5年PyTorch大数据处理框架(Spark/Hadoop/H