职位详情
以下方向均可投递:
LLM/多模态,pretrain:预训练、Pretrain、多模态融合
RLHF,Reward Model:强化学习 RLHF、奖励模型 Reward Model
01 research:泛化、模型量化加速、长文本 Long context
推理规划:Reasoning、Planning、Agent
Math:
Code:pretrain、sft、RLHF、Code、code agent
职位描述
1、善于挖掘简洁且通用的大模型优化思路,并将其有效应用于不同规模的模型以提升整体表现;
2、探索超大规模模型的能力边界,实施深度系统级优化,增强模型性能与运行效率;
3、推动数据构建、指令微调、偏好对齐及模型结构优化等工作,持续提升模型质量与适应能力;
4、实现相关技术的实际应用落地,覆盖内容生成、逻辑推导、代码生成等场景;
5、深入探究模型在未来实际应用中的潜在价值,拓展其使用边界与适用领域。
职位要求
1、具备扎实的编程能力、数据结构与算法基础,熟练掌握 C/C++ 或 Python;
2、熟悉自然语言处理、计算机视觉等相关算法与技术,在上述领域有良好研究成果者优先,有大模型训练或强化学习算法经验者优先;
3、在大模型方向主导过具有广泛影响力的项目或论文者优先;
4、具备优秀的分析与解决问题能力,能够深入应对大模型训练与应用中的关键技术挑战;
5、拥有良好的团队协作与沟通能力,能与团队共同探索前沿技术,推动技术创新与落地。
LLM/多模态,pretrain:预训练、Pretrain、多模态融合
RLHF,Reward Model:强化学习 RLHF、奖励模型 Reward Model
01 research:泛化、模型量化加速、长文本 Long context
推理规划:Reasoning、Planning、Agent
Math:
Code:pretrain、sft、RLHF、Code、code agent
职位描述
1、善于挖掘简洁且通用的大模型优化思路,并将其有效应用于不同规模的模型以提升整体表现;
2、探索超大规模模型的能力边界,实施深度系统级优化,增强模型性能与运行效率;
3、推动数据构建、指令微调、偏好对齐及模型结构优化等工作,持续提升模型质量与适应能力;
4、实现相关技术的实际应用落地,覆盖内容生成、逻辑推导、代码生成等场景;
5、深入探究模型在未来实际应用中的潜在价值,拓展其使用边界与适用领域。
职位要求
1、具备扎实的编程能力、数据结构与算法基础,熟练掌握 C/C++ 或 Python;
2、熟悉自然语言处理、计算机视觉等相关算法与技术,在上述领域有良好研究成果者优先,有大模型训练或强化学习算法经验者优先;
3、在大模型方向主导过具有广泛影响力的项目或论文者优先;
4、具备优秀的分析与解决问题能力,能够深入应对大模型训练与应用中的关键技术挑战;
5、拥有良好的团队协作与沟通能力,能与团队共同探索前沿技术,推动技术创新与落地。
2026-07-01 14:37
IP属地:广东深圳
职位福利
博士经验不限agentcode预训练强化学习mathLLMpretrainRLHF

杭州阿里云飞天信息技术有限公司
10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI大模型开发工程师(金融量化Agent方向)
2-3.5万元/月
大模型算法5-10年本科Agentic系统Java/Go/PythonRedisMongoDBKafka
深圳 南山区
AIGC算法工程师(派驻中国香港)
2.5-4万元/月
大模型算法1-3年硕士AIGC算法ControlNetStable DiffusionHugging Face大模型API照片视频生成
深圳 南山区











