职位详情
1、负责大模型驱动的AI Agent全周期研发工作,涵盖通用及垂直场景下智能体的架构设计、数据体系搭建、模型训练与效果评估;
2、采用SFT、强化学习等模型后训练技术,增强大模型在自主任务规划、多阶段推理、检索增强生成、工具调用、数据问答与文本创作等方面的表现能力;
3、搭建支持Agent强化学习的训练环境与方法体系,设计有效的Reward机制与优化策略,提升模型在特定领域的泛化能力,探索低依赖或无需人工标注样本的智能体优化路径;
4、关注大模型与智能体方向的国际前沿进展,推进先进技术在实际业务中的落地,重点攻关工具联动复杂推理、数据智能分析、AI驱动搜索、图像序列编辑、图形界面操作代理等创新应用;
5、持续迭代智能体算法与系统结构,建立端到端的Agent评测框架,研发自动化评测模块与多维度评估标准,全面提升智能体系统的运行效能与稳定性
2、采用SFT、强化学习等模型后训练技术,增强大模型在自主任务规划、多阶段推理、检索增强生成、工具调用、数据问答与文本创作等方面的表现能力;
3、搭建支持Agent强化学习的训练环境与方法体系,设计有效的Reward机制与优化策略,提升模型在特定领域的泛化能力,探索低依赖或无需人工标注样本的智能体优化路径;
4、关注大模型与智能体方向的国际前沿进展,推进先进技术在实际业务中的落地,重点攻关工具联动复杂推理、数据智能分析、AI驱动搜索、图像序列编辑、图形界面操作代理等创新应用;
5、持续迭代智能体算法与系统结构,建立端到端的Agent评测框架,研发自动化评测模块与多维度评估标准,全面提升智能体系统的运行效能与稳定性
2026-05-16 14:07
IP属地:浙江杭州
职位福利
硕士3-5年

浙江天猫技术有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









