职位详情
任职要求:
1、统招本科及以上学历(必需),专业不限(汉语言、新闻传播、心理学等相关专业优先;英语六级及以上优先);
2、熟悉知识问答、闲聊、文创等内容的标注与评估方法,掌握准确性、相关性、对话节奏等核心评测维度,能理解多轮对话场景下的数据特征,对语义表达与内容质量有较强感知力;
3、具备扎实的文本理解与逻辑分析能力,能够高效识别内容问题,并进行准确分类与清晰描述;
4、具备基础的数据处理能力及学习能力,有大模型项目经验或带教经历者优先,熟悉主流AI产品者优先考虑。
岗位职责:
1、产品功能与体验评估:参与大模型产品的全流程体验测评,涵盖问答准确度、闲聊流畅性、指令遵循能力、多轮对话连贯性、角色一致性、拒答合理性等维度,输出结构化评估反馈;
2、根据评估目标,搭建并维护高质量测试集,针对特定应用场景(如文创创作、知识问答、角色模拟等)设计测试Prompt及典型Bad Case,发现模型潜在问题;
3、问题归因与案例沉淀:对发现问题进行标准化分类与详细描述,建立可追溯的问题档案,支撑后续迭代优化;
4、标准与流程优化:在执行过程中识别评测标准中的模糊点及流程瓶颈,提出切实可行的改进建议,推动规范持续升级;
5、参与标准解读与答疑,协助新成员掌握验收要求,分享评估方法与典型案例,提升团队整体评估一致性。
职业素养:
1、工作认真细致,责任心强,对数据质量高度关注,能够严格遵循操作规范;
2、具备良好抗压能力,能适应一定重复性任务,在周期性工作中保持稳定输出;
3、沟通表达清晰,能够准确传递问题信息,与项目经理及团队成员高效协同;
4、具备主动思考意识,对大模型交互场景有一定理解,保持持续学习态度;
5、对AI产品具有较强的用户视角敏感度,能基于真实使用情境评估模型表现,而非机械执行规则。
1、统招本科及以上学历(必需),专业不限(汉语言、新闻传播、心理学等相关专业优先;英语六级及以上优先);
2、熟悉知识问答、闲聊、文创等内容的标注与评估方法,掌握准确性、相关性、对话节奏等核心评测维度,能理解多轮对话场景下的数据特征,对语义表达与内容质量有较强感知力;
3、具备扎实的文本理解与逻辑分析能力,能够高效识别内容问题,并进行准确分类与清晰描述;
4、具备基础的数据处理能力及学习能力,有大模型项目经验或带教经历者优先,熟悉主流AI产品者优先考虑。
岗位职责:
1、产品功能与体验评估:参与大模型产品的全流程体验测评,涵盖问答准确度、闲聊流畅性、指令遵循能力、多轮对话连贯性、角色一致性、拒答合理性等维度,输出结构化评估反馈;
2、根据评估目标,搭建并维护高质量测试集,针对特定应用场景(如文创创作、知识问答、角色模拟等)设计测试Prompt及典型Bad Case,发现模型潜在问题;
3、问题归因与案例沉淀:对发现问题进行标准化分类与详细描述,建立可追溯的问题档案,支撑后续迭代优化;
4、标准与流程优化:在执行过程中识别评测标准中的模糊点及流程瓶颈,提出切实可行的改进建议,推动规范持续升级;
5、参与标准解读与答疑,协助新成员掌握验收要求,分享评估方法与典型案例,提升团队整体评估一致性。
职业素养:
1、工作认真细致,责任心强,对数据质量高度关注,能够严格遵循操作规范;
2、具备良好抗压能力,能适应一定重复性任务,在周期性工作中保持稳定输出;
3、沟通表达清晰,能够准确传递问题信息,与项目经理及团队成员高效协同;
4、具备主动思考意识,对大模型交互场景有一定理解,保持持续学习态度;
5、对AI产品具有较强的用户视角敏感度,能基于真实使用情境评估模型表现,而非机械执行规则。
2026-06-26 13:41
IP属地:浙江杭州
职位福利
本科1年以下文本标注

深圳市法本信息技术股份有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











