通义实验室-大模型算法-基座

4.5-7.5万元/月

深圳·南山区

刘先生

已实名

企业认证

杭州阿里云飞天信息技术有限公司

职位详情

大模型算法

以下方向均可投递：
LLM/多模态，pretrain：预训练、Pretrain、多模态融合
RLHF，Reward Model：强化学习 RLHF、奖励模型 Reward Model
01 research：泛化、模型量化加速、长文本 Long context
推理规划：Reasoning、Planning、Agent
Math：
Code：pretrain、sft、RLHF、Code、code agent

职位描述
1、善于挖掘简洁且通用的大模型优化思路，并将其有效应用于不同规模的模型以提升整体表现；
2、探索超大规模模型的能力边界，实施深度系统级优化，增强模型性能与运行效率；
3、推动数据构建、指令微调、偏好对齐及模型结构优化等工作，持续提升模型质量与适应能力；
4、实现相关技术的实际应用落地，覆盖内容生成、逻辑推导、代码生成等场景；
5、深入探究模型在未来实际应用中的潜在价值，拓展其使用边界与适用领域。

职位要求
1、具备扎实的编程能力、数据结构与算法基础，熟练掌握 C/C++ 或 Python；
2、熟悉自然语言处理、计算机视觉等相关算法与技术，在上述领域有良好研究成果者优先，有大模型训练或强化学习算法经验者优先；
3、在大模型方向主导过具有广泛影响力的项目或论文者优先；
4、具备优秀的分析与解决问题能力，能够深入应对大模型训练与应用中的关键技术挑战；
5、拥有良好的团队协作与沟通能力，能与团队共同探索前沿技术，推动技术创新与落地。

2026-07-01 14:37

IP属地：广东深圳

职位福利

博士经验不限agentcode预训练强化学习mathLLMpretrainRLHF