职位详情
岗位要求:
1. 学历与经验: 本科及以上学历,拥有1-3年数据标注、质量评估、内容审核或相关领域工作经验;不限行业背景(互联网、咨询、传统行业等具备评测经验者均可)。需对AIGC类应用如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion中的一种或多种有深入使用经历,熟悉图生文/文生图/文生视频技术的特点与能力边界。具备LoRA训练或ComfyUI使用经验者优先考虑。
2. 逻辑思维: 具备良好的推理判断能力,能识别复杂文本中的逻辑矛盾,对内容的连贯性与合理性有较强辨别力。
3. 主观感知力(高情商表现): 拥有出色的语义理解能力,不仅能判断正误,更能感知回复的“质感”,对主观体验的优劣具备敏锐且精准的把握。
4. 反馈沟通: 表达清晰、客观,能够准确描述评测过程中出现的标准争议,并及时反馈,确保信息传达准确无误。
5. 工作态度: 严谨踏实,能够适应重复性评估任务,并在稳定节奏中保持专注与高效输出。
6. 加分项(在满足基本条件基础上):
a. 领域背景: 具备代码、医疗、金融、命理星象等领域专业知识者优先;
b. 大模型经验: 有参与过大模型(LLM)或视觉语言模型(VLM)相关标注项目者优先;
c. 多模态经验: 具备文生图(Text-to-Image)或文生视频(Text-to-Video)方向的评测或打分经验者优先;
岗位职责:
1. 模型输出评分: 负责对VLM(视觉语言模型)生成的图生文结果进行质量评估,围绕逻辑准确性、事实一致性、是否存在幻觉等维度进行精确评分。
2. 评测集构建: 协助业务团队搭建多模态评测题库,包括收集或筛选特定场景图像,并依据需求撰写高质量、具区分度的Prompt(提示词)。
3. 逻辑与理解判断: 在评测过程中,准确识别模型在逻辑推理和语义理解方面的表现,发现回复中存在的细微逻辑问题或语义偏差。
4. 主观体验评估: 从用户角度出发,对模型回复的整体质量进行“主观好坏”评判,涵盖是否自然流畅、是否贴合语境,以及表达是否符合人类习惯与审美标准。
5. 问题整理与反馈: 汇总评测中出现的典型错误案例(Badcase),完整记录并提交给内部负责人,协助汇总优化建议(无需直接对接研发人员)。
6. 标准执行与对齐: 快速掌握并严格执行评测标准流程(SOP),确保在持续任务中保持评分的一致性与专业性。
1. 学历与经验: 本科及以上学历,拥有1-3年数据标注、质量评估、内容审核或相关领域工作经验;不限行业背景(互联网、咨询、传统行业等具备评测经验者均可)。需对AIGC类应用如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion中的一种或多种有深入使用经历,熟悉图生文/文生图/文生视频技术的特点与能力边界。具备LoRA训练或ComfyUI使用经验者优先考虑。
2. 逻辑思维: 具备良好的推理判断能力,能识别复杂文本中的逻辑矛盾,对内容的连贯性与合理性有较强辨别力。
3. 主观感知力(高情商表现): 拥有出色的语义理解能力,不仅能判断正误,更能感知回复的“质感”,对主观体验的优劣具备敏锐且精准的把握。
4. 反馈沟通: 表达清晰、客观,能够准确描述评测过程中出现的标准争议,并及时反馈,确保信息传达准确无误。
5. 工作态度: 严谨踏实,能够适应重复性评估任务,并在稳定节奏中保持专注与高效输出。
6. 加分项(在满足基本条件基础上):
a. 领域背景: 具备代码、医疗、金融、命理星象等领域专业知识者优先;
b. 大模型经验: 有参与过大模型(LLM)或视觉语言模型(VLM)相关标注项目者优先;
c. 多模态经验: 具备文生图(Text-to-Image)或文生视频(Text-to-Video)方向的评测或打分经验者优先;
岗位职责:
1. 模型输出评分: 负责对VLM(视觉语言模型)生成的图生文结果进行质量评估,围绕逻辑准确性、事实一致性、是否存在幻觉等维度进行精确评分。
2. 评测集构建: 协助业务团队搭建多模态评测题库,包括收集或筛选特定场景图像,并依据需求撰写高质量、具区分度的Prompt(提示词)。
3. 逻辑与理解判断: 在评测过程中,准确识别模型在逻辑推理和语义理解方面的表现,发现回复中存在的细微逻辑问题或语义偏差。
4. 主观体验评估: 从用户角度出发,对模型回复的整体质量进行“主观好坏”评判,涵盖是否自然流畅、是否贴合语境,以及表达是否符合人类习惯与审美标准。
5. 问题整理与反馈: 汇总评测中出现的典型错误案例(Badcase),完整记录并提交给内部负责人,协助汇总优化建议(无需直接对接研发人员)。
6. 标准执行与对齐: 快速掌握并严格执行评测标准流程(SOP),确保在持续任务中保持评分的一致性与专业性。
2026-02-25 14:35
IP属地:北京
职位福利
本科1-3年

博彦科技(深圳)有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
西班牙语质量检测标注
1-1.2万元/月
数据标注/AI训练师1-3年本科西班牙语专业四级西班牙语专业八级CATTI翻译资格证CATTI西班牙语二级笔译CATTI西班牙语三级笔译CATTI西班牙语一级笔译
北京 海淀区
数据标注实习生170-200一天
170-200元/天
兼职数据标注/AI训练师1年以下大专不接受居家办公图片标注文本标注国内院校优先数据分析能力强标注方法优化标注结果整理
北京 海淀区







