职位详情
岗位职责
1. 负责豆包Agent体系的评测工作及评测数据集建设,设计贴近实际用户使用场景的评估任务,确保题目表述清晰、合理,符合真实用户需求,避免抽象或脱离实际;
2. 结合用户真实意图与复杂任务特点,制定异步处理、多步骤任务的判断依据与评估标准,形成可执行的评测规则;
3. 对Agent调用表现进行效果评估,重点考察是否准确理解用户指令、正确触发对应Agent、有效达成用户目标,而非仅关注界面呈现或视觉结果;
4. 与团队协作完善评测机制,沉淀标准化流程、任务模板及典型样例库,增强团队对复杂任务的一致理解与执行能力;
5. 基于用户交互行为数据与评测反馈,输出问题分析报告并提出优化建议,助力提升Agent的理解与调度性能。
任职要求
1. 本科及以上学历,综合素质优秀,学习能力强,能快速掌握并落实复杂的业务规则;
2. 具备出色的文字理解与表达能力,思维有条理,善于捕捉用户核心意图,梳理任务逻辑流程;
3. 用户视角敏锐,能够从真实使用者角度出发设计评测任务,判断需求合理性;
4. 熟悉AI大模型、Agent机制、工具调用、多轮对话等相关概念或具备实践经验者优先;
5. 工作认真细致,责任感强,具备良好的沟通协作能力和规则执行落地能力;
6. 不硬性要求美学或设计背景,更重视逻辑思维、用户感知力与语言表达能力
【评测2-侧重美学背景】
重点关注具有美学相关背景并具备Agent实践经验的候选人,参与过SP调试,或搭建过coze、dify等workflow类工具,曾通过PE解决实际业务问题,熟悉SP编写规范,有Agent相关项目经历者更佳。参考要求如下:
- 具备AI类产品工作经验,如图像处理、视频处理、创意类工具、Agent应用等相关领域经验
- 了解模型与算法实现的基本原理,能对效果实现方案提供专业且高效的评估建议,并推动方案落地
- 对图像或视频类产品的设计方法论有系统认知,能独立完成需求挖掘、定义到迭代的全流程闭环
- 熟悉常用图像处理与设计软件,具备一定的产品审美能力,有摄影爱好的候选人优先
1. 负责豆包Agent体系的评测工作及评测数据集建设,设计贴近实际用户使用场景的评估任务,确保题目表述清晰、合理,符合真实用户需求,避免抽象或脱离实际;
2. 结合用户真实意图与复杂任务特点,制定异步处理、多步骤任务的判断依据与评估标准,形成可执行的评测规则;
3. 对Agent调用表现进行效果评估,重点考察是否准确理解用户指令、正确触发对应Agent、有效达成用户目标,而非仅关注界面呈现或视觉结果;
4. 与团队协作完善评测机制,沉淀标准化流程、任务模板及典型样例库,增强团队对复杂任务的一致理解与执行能力;
5. 基于用户交互行为数据与评测反馈,输出问题分析报告并提出优化建议,助力提升Agent的理解与调度性能。
任职要求
1. 本科及以上学历,综合素质优秀,学习能力强,能快速掌握并落实复杂的业务规则;
2. 具备出色的文字理解与表达能力,思维有条理,善于捕捉用户核心意图,梳理任务逻辑流程;
3. 用户视角敏锐,能够从真实使用者角度出发设计评测任务,判断需求合理性;
4. 熟悉AI大模型、Agent机制、工具调用、多轮对话等相关概念或具备实践经验者优先;
5. 工作认真细致,责任感强,具备良好的沟通协作能力和规则执行落地能力;
6. 不硬性要求美学或设计背景,更重视逻辑思维、用户感知力与语言表达能力
【评测2-侧重美学背景】
重点关注具有美学相关背景并具备Agent实践经验的候选人,参与过SP调试,或搭建过coze、dify等workflow类工具,曾通过PE解决实际业务问题,熟悉SP编写规范,有Agent相关项目经历者更佳。参考要求如下:
- 具备AI类产品工作经验,如图像处理、视频处理、创意类工具、Agent应用等相关领域经验
- 了解模型与算法实现的基本原理,能对效果实现方案提供专业且高效的评估建议,并推动方案落地
- 对图像或视频类产品的设计方法论有系统认知,能独立完成需求挖掘、定义到迭代的全流程闭环
- 熟悉常用图像处理与设计软件,具备一定的产品审美能力,有摄影爱好的候选人优先
2026-05-19 12:58
IP属地:北京
职位福利
本科经验不限图像标注

上海思芮信息科技有限公司
1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












