职位详情
电商文本/语音标注
岗位职责:
1、产品功能与体验评测:参与大模型产品的端到端使用体验评估,涵盖问答准确率、对话自然度、指令理解能力、多轮交互连贯性、角色设定一致性、拒绝回答合理性等方面,输出条理清晰的评测结果;
2、根据评估目标,搭建并持续优化高质量评测数据集,围绕特定应用情境(如文创创作、知识查询、角色模拟等)设计测试指令及典型问题案例,识别模型表现盲区;
3、问题归因与case沉淀:对发现的问题进行标准化分类与详细描述,建立可追踪的问题档案,支撑后续迭代分析;
4、标准与流程反馈:在执行过程中及时识别评估标准中的歧义项或流程瓶颈,提出切实可行的改进建议,助力规范体系不断优化;
5、参与标准解读与团队支持,协助新成员掌握验收要点,分享评估经验与代表性案例,促进团队整体评判一致性。
任职要求:
1、工作严谨、责任感强,重视数据准确性,能严格遵循既定标准开展工作;
2、具备良好承压能力,可胜任一定强度的重复性任务,并在周期性工作中保持输出稳定;
3、表达流畅,能精准传达问题点,与项目负责人及团队成员实现高效协同;
4、具有主动思考习惯,对大模型交互场景有一定理解,并保持持续学习态度;
5、对AI类产品具备较强的用户视角敏感性,能基于真实使用情境判断模型表现,而非机械套用规则。
岗位职责:
1、产品功能与体验评测:参与大模型产品的端到端使用体验评估,涵盖问答准确率、对话自然度、指令理解能力、多轮交互连贯性、角色设定一致性、拒绝回答合理性等方面,输出条理清晰的评测结果;
2、根据评估目标,搭建并持续优化高质量评测数据集,围绕特定应用情境(如文创创作、知识查询、角色模拟等)设计测试指令及典型问题案例,识别模型表现盲区;
3、问题归因与case沉淀:对发现的问题进行标准化分类与详细描述,建立可追踪的问题档案,支撑后续迭代分析;
4、标准与流程反馈:在执行过程中及时识别评估标准中的歧义项或流程瓶颈,提出切实可行的改进建议,助力规范体系不断优化;
5、参与标准解读与团队支持,协助新成员掌握验收要点,分享评估经验与代表性案例,促进团队整体评判一致性。
任职要求:
1、工作严谨、责任感强,重视数据准确性,能严格遵循既定标准开展工作;
2、具备良好承压能力,可胜任一定强度的重复性任务,并在周期性工作中保持输出稳定;
3、表达流畅,能精准传达问题点,与项目负责人及团队成员实现高效协同;
4、具有主动思考习惯,对大模型交互场景有一定理解,并保持持续学习态度;
5、对AI类产品具备较强的用户视角敏感性,能基于真实使用情境判断模型表现,而非机械套用规则。
2026-05-20 12:50
IP属地:浙江杭州
职位福利
本科1-3年文本标注语音标注图像标注音频标注

深圳市法本信息技术股份有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








