职位详情
一、岗位职责
协助实现和调试基础强化学习算法(如PPO、TD3、SAC等)的训练脚本,包括奖励函数、初始化函数、终止函数及观察空间的配置与修改。
协助完成一些其他AI相关事项的开发和调优(如大模型)和售前工作。
二、任职资格
1、熟练掌握Python,能使用NumPy/Pandas等进行数据处理;了解或使用过至少一种深度学习/强化学习框架(如PyTorch、TensorFlow、Stable-Baselines3等)。
2、学习能力强,动手能力好,责任心强,能在指导下快速理解需求,愿意在AI方向持续投入与成长。
3、具备良好的数学与基础理论功底,理解概率论、线性代数、最优化等基础概念,对强化学习基本原理(如MDP、状态、动作、奖励、价值函数等)有初步了解。
协助实现和调试基础强化学习算法(如PPO、TD3、SAC等)的训练脚本,包括奖励函数、初始化函数、终止函数及观察空间的配置与修改。
协助完成一些其他AI相关事项的开发和调优(如大模型)和售前工作。
二、任职资格
1、熟练掌握Python,能使用NumPy/Pandas等进行数据处理;了解或使用过至少一种深度学习/强化学习框架(如PyTorch、TensorFlow、Stable-Baselines3等)。
2、学习能力强,动手能力好,责任心强,能在指导下快速理解需求,愿意在AI方向持续投入与成长。
3、具备良好的数学与基础理论功底,理解概率论、线性代数、最优化等基础概念,对强化学习基本原理(如MDP、状态、动作、奖励、价值函数等)有初步了解。
2026-07-01 14:22
IP属地:四川
职位福利
本科经验不限

成都步速者科技股份有限公司
未融资 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
飞控算法工程师
2-3万元/月
算法工程师本科推荐算法SLAM算法搜索算法语音算法多模态算法模型加速/性能优化风控算法通信算法C/C++PythonJavaMATLAB并行计算嵌入式开发大数据处理框架(Spark/Hadoop/Hive)分布式训练SQLShellScala深度学习大模型算法强化学习算法工程化经验团队管理经验优秀开源项目经历
成都 青羊区 人民公园
AI算法工程师(边缘计算设备)
1.2-2.4万元/月
算法工程师3-5年本科机器学习图像算法深度学习TransformerPyTorchTensorFlowOpenCV
成都 青羊区









