多模态评估分析

8000-13000元/月

海淀区

程女士

已实名

企业认证

博彦科技（深圳）有限公司

职位详情

数据标注/AI训练师

岗位要求：
1. 学历与经验：本科及以上学历，拥有1-3年数据标注、质量评估、内容审核或相关领域工作经验；不限行业背景（互联网、咨询、传统行业等具备评测经验者均可）。需对AIGC类应用如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion中的一种或多种有深入使用经历，熟悉图生文/文生图/文生视频技术的特点与能力边界。具备LoRA训练或ComfyUI使用经验者优先考虑。
2. 逻辑思维：具备良好的推理判断能力，能识别复杂文本中的逻辑矛盾，对内容的连贯性与合理性有较强辨别力。
3. 主观感知力（高情商表现）：拥有出色的语义理解能力，不仅能判断正误，更能感知回复的“质感”，对主观体验的优劣具备敏锐且精准的把握。
4. 反馈沟通：表达清晰、客观，能够准确描述评测过程中出现的标准争议，并及时反馈，确保信息传达准确无误。
5. 工作态度：严谨踏实，能够适应重复性评估任务，并在稳定节奏中保持专注与高效输出。
6. 加分项（在满足基本条件基础上）：
a. 领域背景：具备代码、医疗、金融、命理星象等领域专业知识者优先；
b. 大模型经验：有参与过大模型（LLM）或视觉语言模型（VLM）相关标注项目者优先；
c. 多模态经验：具备文生图（Text-to-Image）或文生视频（Text-to-Video）方向的评测或打分经验者优先；

岗位职责：
1. 模型输出评分：负责对VLM（视觉语言模型）生成的图生文结果进行质量评估，围绕逻辑准确性、事实一致性、是否存在幻觉等维度进行精确评分。
2. 评测集构建：协助业务团队搭建多模态评测题库，包括收集或筛选特定场景图像，并依据需求撰写高质量、具区分度的Prompt（提示词）。
3. 逻辑与理解判断：在评测过程中，准确识别模型在逻辑推理和语义理解方面的表现，发现回复中存在的细微逻辑问题或语义偏差。
4. 主观体验评估：从用户角度出发，对模型回复的整体质量进行“主观好坏”评判，涵盖是否自然流畅、是否贴合语境，以及表达是否符合人类习惯与审美标准。
5. 问题整理与反馈：汇总评测中出现的典型错误案例（Badcase），完整记录并提交给内部负责人，协助汇总优化建议（无需直接对接研发人员）。
6. 标准执行与对齐：快速掌握并严格执行评测标准流程（SOP），确保在持续任务中保持评分的一致性与专业性。

2026-02-25 14:35

IP属地：北京

职位福利

本科1-3年