职位详情
LLM/多模态预训练:大规模语言模型与多模态联合建模、预训练技术、多模态信息融合
强化学习与奖励机制:基于人类反馈的强化学习(RLHF)、奖励模型构建与优化
01 研究方向:模型泛化能力提升、模型量化与推理加速、长上下文处理(Long Context)
推理与决策系统:逻辑推理 Reasoning、任务规划 Planning、智能体 Agent 构建
数学领域研究:数学问题理解与求解相关算法探索
代码生成方向:代码预训练、监督微调 SFT、RLHF 优化、代码生成模型、Code Agent 系统开发
多模态大模型体系:
- 多模态基础模型架构设计
- 理解与生成一体化统一模型
- 世界模型构建、GUI 智能代理、数据预训练对齐策略
- 训练过程优化与评估体系、Agent 开发全流程支持
AIGC 算法研发:
- 图像内容生成、视频生成技术
- 多模态数据服务平台构建
- 大模型推理与训练效率优化
- 高性能计算架构支持
强化学习与奖励机制:基于人类反馈的强化学习(RLHF)、奖励模型构建与优化
01 研究方向:模型泛化能力提升、模型量化与推理加速、长上下文处理(Long Context)
推理与决策系统:逻辑推理 Reasoning、任务规划 Planning、智能体 Agent 构建
数学领域研究:数学问题理解与求解相关算法探索
代码生成方向:代码预训练、监督微调 SFT、RLHF 优化、代码生成模型、Code Agent 系统开发
多模态大模型体系:
- 多模态基础模型架构设计
- 理解与生成一体化统一模型
- 世界模型构建、GUI 智能代理、数据预训练对齐策略
- 训练过程优化与评估体系、Agent 开发全流程支持
AIGC 算法研发:
- 图像内容生成、视频生成技术
- 多模态数据服务平台构建
- 大模型推理与训练效率优化
- 高性能计算架构支持
2026-06-21 12:27
IP属地:上海
职位福利
博士1-3年多模态code预训练reasoningLLM推理规划pretrainRLHF

杭州阿里云飞天信息技术有限公司
10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI算法大模型工程师(视频面试)
1.6-1.8万元/月
大模型算法3-5年本科AI平台算法大模型应用机器学习python后端RAG架构Agent金融行业LangChain/LangGraph
上海 浦东新区










