职位详情
岗位1 文本标注 要求: 1、本科及以上学历(必需),专业不限(汉语言、新闻传播、心理学等相关专业优先;英语六级及以上优先); 2、熟悉知识问答、闲聊、文创等标注与评测方法,了解准确性、相关性、对话节奏性等核心评测指标,能够理解多轮对话场景的数据特性,对内容质量及语义理解具备敏感度; 3、具备较强的文本理解与逻辑分析能力,能够快速判断内容质量、识别问题并进行清晰分类与描述; 4、具备基础的数据处理能力与学习能力,有大模型相关经验或带教经验优先,熟悉主流AI产品者加分。 业务要求 1、产品功能与体验评测:参与大模型产品的端到端体验评测,包括但不限于问答准确性、闲聊自然度、指令遵循能力、多轮对话连贯性、角色扮演一致性、拒答合理性等维度,输出结构化体验反馈; 2、依据评测需求,构建并维护高质量的评测集,针对特定场景(如文创写作、知识问答、角色扮演等)设计测试Prompt及Bad Case,挖掘模型潜在缺陷; 3、问题归因与case沉淀:对问题case进行规范分类与清晰描述,形成可追溯的问题记录,支持后续分析与优化; 4、标准与流程反馈:在验收过程中主动发现评测标准模糊点及流程问题,提出有效优化建议,推动标准持续完善; 5、参与规范宣导及答疑,协助新人理解验收标准,分享评测技巧与典型Case,提升团队整体质量一致性。 岗位2 语音 要求: 1、本科及以上学历(必需),专业不限(汉语言、新闻传播、心理学等相关专业优先;英语六级及以上优先); 2、熟悉知识问答、闲聊等标注与评测方法,了解准确率、相关性、完整性等核心评测指标,能够理解多轮对话及语音通话场景的数据特性,对语音质量及语义理解具备敏感度; 3、具备较强的文本理解与逻辑分析能力,能够快速判断内容质量、识别问题并进行清晰分类与描述; 4、具备基础的数据处理能力与学习能力,有大模型相关经验或带教经验优先,熟悉主流AI产品者加分。 业务要求 1、产品功能与体验评测:参与大模型产品的端到端体验评测,包括但不限于识别语音与多轮对话中的问题,从问答准确性、闲聊自然度、指令遵循能力、多轮对话连贯性、角色扮演一致性、拒答合理性等维度,输出结构化体验反馈; 2、依据评测需求,构建并维护高质量的评测集,针对特定场景如外教陪练、模拟面试等场景设计测试Prompt及Bad Case,挖掘模型潜在缺陷; 3、问题归因与case沉淀:对问题case进行规范分类与清晰描述,形成可追溯的问题记录,支持后续分析与优化; 4、标准与流程反馈:在验收过程中主动发现评测标准模糊点及流程问题,提出有效优化建议,推动标准持续完善; 5、参与规范宣导及答疑,协助新人理解验收标准,分享评测技巧与典型Case,提升团队整体质量一致性。 岗位3 多模态 要求: 1. 本科及以上学历,计算机、语言学、中文、数学等相关专业优先。 2. 1年及以上多模态大模型评测经验,有VQA、问答评测经验者优先。 3. 可快速上手各类场景评测逻辑,熟悉大模型评测逻辑和评测体系者加分。 业务要求 1. 具备扎实文本理解、逻辑分析能力,能精准判定用户需求及大模型内容质量与价值。 2. 沟通表达流畅,可开展团队标注标准培训、答疑,保障标准统一。 3. 学习能力强、灵活性佳,擅长协作。 4.具备LLM/VLM大模型评测经验,熟悉各大AI产品最新产品形态,具备大语言基座模型训练评测经验者优先。
2026-06-16 15:17
IP属地:浙江杭州
职位福利
本科1-3年图像标注语音标注音频标注视频标注文本标注

深圳市法本信息技术股份有限公司
已上市 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










