搜索
登录注册

职位详情

职位描述:
1、负责强化学习(RL)核心算法的设计与工程实现,打造高效智能决策模型,支撑软件系统全流程(需求分析-架构设计-部署运维)的智能化升级;
2、推进深度强化学习(DRL)关键技术研究,聚焦大语言模型(LLM)与多智能体强化学习(MARL)的协同创新,加速其在能源微电网、工业自动化等复杂场景的大规模落地应用。

职位要求:

硬性条件:
1、具备3年以上强化学习实际项目经验,熟练掌握DQN、PPO、SAC等主流算法,拥有大规模强化学习系统上线实践;
2、熟练运用PyTorch/TensorFlow框架进行模型开发与优化;
3、在ICML/NeurIPS/AAAI等顶级会议发表过相关论文者优先考虑。

加分项:
1、有大语言模型(LLM)调优或RLHF(基于人类反馈的强化学习)项目实操经验;
2、了解多智能体博弈机制与联邦学习技术,具备电力调度、机器人控制等领域项目背景;
3、数学功底扎实,熟悉随机过程、博弈论及最优控制等相关理论。

软性素质:
1、具备技术敏锐度,能快速理解并复现前沿研究成果,推动算法迭代与创新;
2、目标驱动,善于从实际业务问题出发反向设计技术解决方案。
2026-06-24 13:05
IP属地:湖北武汉

职位福利

本科3-5年PyTorch大数据处理框架(Spark/Hadoop/Hive)强化学习RLLLM模型加速/性能优化TensorFlow
企业发布信息图
深圳市中电电力技术股份有限公司
未融资 · 1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

点云 算法工程师
26-30万元/月
算法工程师1-3年硕士
武汉 洪山区 关山
机器人算法工程师
2-3.5万元/月
算法工程师1-3年硕士图像算法规控算法多模态算法融合感知算法C/C++算法工程化经验发表算法相关优秀论文优秀开源项目经历
武汉 洪山区 光谷
人形机器人运动控制算法工程师
3.5-5万元/月
算法工程师经验不限硕士机器人算法机器避障运动控制算法
武汉 洪山区
炒菜机器人研发工程师
2.5-3万元/月
算法工程师1-3年本科
武汉 东西湖区
遥感算法工程师
1.5-1.6万元/月
算法工程师经验不限本科导航算法PyTorchPython多模态算法大模型算法图像算法
武汉 武昌区
人工智能算法工程师
9000-17000元/月
算法工程师3-5年本科深度学习机器学习通信算法TensorFlowPyTorchPython网络优化与故障预测跨团队技术协作
武汉 江汉区
算法研发工程师
1.5-1.6万元/月
算法工程师1-3年本科自然语言处理知识图谱通信算法深度学习图像算法大模型算法
武汉 武昌区
强化学习算法工程师
4-6万元/月
算法工程师5-10年硕士搜索算法规控算法分布式训练深度学习大模型算法多模态算法算法工程化经验优秀开源项目经历推荐算法发表算法相关优秀论文机器学习参加算法相关竞赛/获奖Python
武汉 洪山区
大模型算法研发工程师
1.5-2.5万元/月
算法工程师3-5年本科PytorchC/C++大模型算法自然语言处理算法Python
武汉 东西湖区
AI算法研发工程师
8000-16000元/月
算法工程师1-3年本科图像算法机器视觉通信算法人工神经网络TransformerPythonC++
武汉 东西湖区