AI数据标注/评测（外包/双休/五险一金）

8000-12000元/月

海淀区

程女士

已实名

企业认证

博彦科技（深圳）有限公司

职位详情

数据标注/AI训练师

岗位名称：多模态评测岗位

岗位要求：
1. 学历与经验：本科及以上学历，专业不限。具备1-3年数据标注、质量评估、内容审核或相关领域工作经验，行业背景不限（互联网、咨询、传统行业等相关评估经历均可）。需对AIGC类产品如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion等中的一种或多种有深入使用经验，熟悉图生文/文生图/文生视频技术的特点与能力边界。有训练LoRA或使用ComfyUI经验者优先考虑。
2. 逻辑思维：具备清晰的推理能力，能够识别复杂语句中的逻辑陷阱，对内容的一致性与合理性具有较强辨别力。
3. 主观感知力（高情商表现）：拥有良好的语义理解能力，不仅能判断正误，还能感知回复的“质感”，对主观体验的好坏具备敏锐且准确的判断力。
4. 反馈沟通：表达条理清晰、客观准确，能就评测标准中存在的争议点进行有效描述并及时反馈，确保信息传递完整无误。
5. 工作态度：细致沉稳，能适应重复性评估任务，并在持续工作中保持专注与高效输出。
6. 加分项（在满足基础条件基础上）：
a. 领域背景：具备代码、医疗、金融、命理星象等领域专业知识者优先；
b. 大模型经验：有大模型（LLM）或图生文（VLM）相关标注经验者优先；
c. 多模态经验：具备文生图（Text-to-Image）或文生视频（Text-to-Video）相关评估或打分经验者优先。

岗位职责：
1. 模型输出评分：负责对VLM（视觉语言模型）图生文结果进行质量评估，围绕逻辑准确性、事实一致性、是否存在幻觉等维度进行精准评分与判定。
2. 评测集构建：协助业务方搭建多模态评测题目，包括收集和筛选特定场景图片，并根据实际需求撰写高质量、具区分度的Prompt（提示词）。
3. 逻辑与理解把控：在评测过程中，准确识别模型在逻辑推理和语义理解方面的表现，捕捉回复中存在的细微逻辑漏洞或语义偏差。
4. 主观体验评估：从用户视角出发，对模型回复的整体质量进行“主观好坏”评判，包括是否自然流畅、是否贴合语境，以及表达是否符合人类习惯与审美标准。
5. 问题整理与反馈：汇总评测过程中发现的典型错误案例（Badcase），详细记录并提交至内部负责人，协助团队归纳优化策略（无需直接对接研发人员）。
6. 标准执行与对齐：快速掌握并严格执行评测标准（SOP），确保在长期任务中保持评分的一致性与严谨性。

2026-02-20 14:24

IP属地：北京

职位福利

本科1-3年数据标注不接受居家办公语音标注视频标注数据分析能力强标注结果抽查大模型图片标注文本标注标注数据分析标注方法优化标框标注分类标注