搜索
登录注册

职位详情

主要职责
1、算法研究与开发: 深入探索、复现并优化前沿强化学习方法(如PPO, DQN, SAC, 多智能体RL,离线RL,奖励模型设计等),并推动其在海外实际业务场景中的应用落地。
2、用户增长与留存优化: 设计RL智能体,结合个性化推荐、通知策略、激励机制等手段,提升用户的长期留存(LTV)与活跃度,达成增长目标。
3、内容与广告策略优化: 运用强化学习技术动态调整面向全球用户的内容生成、信息流排序及广告投放策略,兼顾用户体验与商业收益的最优匹配。
4、大规模数据训练与仿真环境构建: 搭建高还原度的仿真系统,支持RL模型的高效训练与验证;处理并分析来自全球的海量、多维度用户行为数据。
5、技术前瞻性探索: 密切关注国际AI与强化学习领域的最新动态,探索大语言模型与强化学习融合等新技术在产品创新中的潜在应用。

任职要求
1、计算机科学、人工智能、统计学、应用数学或相关专业硕士及以上学位。
2、具备3年以上强化学习方向的研究或工程实践经验,有完整项目落地成果者优先。
3、精通Python及主流深度学习框架(如PyTorch, TensorFlow)。
4、具有扎实的机器学习基础,熟悉深度学习、概率论、统计推断与优化方法。
5、有大规模数据处理背景,熟练掌握SQL、Pandas、Spark等相关工具。
6、熟悉Linux开发环境,具备良好的工程实现能力,代码风格规范、结构清晰。
2026-06-26 12:20
IP属地:北京

职位福利

硕士3-5年机器学习强化学习
企业发布信息图
贝壳找房(北京)科技有限公司
不需要融资 · 10000人以上
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

搜推算法工程师-双休、亿级用户算法应用场景、重点岗位
3-5万元/月
算法工程师3-5年本科
北京 海淀区 中关村
增长算法工程师/双休/算法驱动增长/深耕核心业务
2.5-4.5万元/月
算法工程师3-5年本科
北京 海淀区 中关村
音频CV数据算法评测工程师
1.3-1.4万元/月
算法工程师1-3年本科PythonAI算法评测视频处理数据统计分析
北京 海淀区
大模型算法工程师(驻场佛山广州)
3-4万元/月
算法工程师经验不限本科文本分析句法分析语义分析PyTorchTensorFlow
北京 海淀区
大气科学博士算法兼职(支持远程)
200-300元/天
算法工程师经验不限博士机器学习气象算法Python
北京 海淀区
算法测试/开发(导师指导,欢迎新手)
1.5-3万元/月
算法工程师经验不限本科
北京 海淀区
研发工程师
2-3.5万元/月
算法工程师3-5年本科C++OpenCV算法设计视觉图像算法视觉检测PythonOCR
北京 海淀区
aiisp算法应用工程师
2.5-4万元/月
算法工程师3-5年硕士
北京 海淀区
GIS 高级算法开发工程师
1.5-3万元/月
算法工程师5-10年本科Java机器学习深度学习大模型算法算法工程化经验强化学习模型加速/性能优化Python
北京 海淀区
灵巧手机器人仿真算法工程师
3.5-6万元/月
算法工程师1-3年硕士发表算法相关优秀论文机器学习多模态算法算法工程化经验强化学习参加算法相关竞赛/获奖模型加速/性能优化Python
北京 海淀区