职位详情
多模态评测岗位
岗位要求:
1. 学历与经验:本科及以上学历,具备1-3年数据标注、质量评估、内容审核或相关领域工作经验;不限行业背景(互联网、咨询、传统行业等相关评估经验均可)。需对AIGC类产品,如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion等中的一种或多种有深入使用经历,熟悉图生文/文生图/文生视频技术的特点与能力边界。具备LoRA训练或ComfyUI使用经验者优先考虑。
2. 逻辑思维:具备良好的逻辑分析能力,能识别复杂文本中的逻辑陷阱,对内容的一致性与合理性具有较强判断力。
3. 主观感知力(高情商表现):拥有出色的语义理解能力,不仅能判断正误,还能感知回复的“质感”,对主观体验的优劣具备敏锐且准确的辨别能力。
4. 反馈沟通:表达清晰、客观,能够准确描述评测过程中遇到的标准争议,并及时反馈,确保信息传达准确无误。
5. 工作态度:细致沉稳,能够适应重复性较强的评估任务,并在长期工作中保持专注与高效输出。
6. 加分项(在满足基本条件基础上):
a. 领域背景:具备代码、医疗、金融、命理星象等领域专业知识者优先;
b. 大模型经验:有大模型(LLM)或图生文(VLM)相关标注经验者优先;
c. 多模态经验:具备文生图(Text-to-Image)或文生视频(Text-to-Video)相关评估或评分经验者优先。
岗位职责:
1. 模型输出评分:负责对VLM(视觉语言模型)图生文结果进行质量评估,围绕逻辑准确性、事实一致性、是否存在幻觉等维度进行精准打分与判定。
2. 评测集构建:协助业务团队搭建多模态评测题库,包括收集或筛选特定场景图片,并依据业务需求撰写高质量、具区分度的Prompt(提示词)。
3. 逻辑与理解审核:在评测过程中,准确识别模型在逻辑推理和语义理解方面的表现,发现回复中存在的细微逻辑问题或语义偏差。
4. 主观体验审核:从用户角度出发,对模型生成内容的整体质量进行“主观好坏”评判,评估其是否自然流畅、贴合语境,以及是否符合人类的语言习惯与审美标准。
5. 问题整理与反馈:系统收集并归类评测中出现的典型错误案例(Badcase),详细记录并提交给项目负责人,协助汇总优化建议(无需直接对接研发人员)。
6. 标准执行与对齐:快速掌握并严格执行评测标准流程(SOP),确保在持续任务中评分结果的一致性与严谨性。
岗位要求:
1. 学历与经验:本科及以上学历,具备1-3年数据标注、质量评估、内容审核或相关领域工作经验;不限行业背景(互联网、咨询、传统行业等相关评估经验均可)。需对AIGC类产品,如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion等中的一种或多种有深入使用经历,熟悉图生文/文生图/文生视频技术的特点与能力边界。具备LoRA训练或ComfyUI使用经验者优先考虑。
2. 逻辑思维:具备良好的逻辑分析能力,能识别复杂文本中的逻辑陷阱,对内容的一致性与合理性具有较强判断力。
3. 主观感知力(高情商表现):拥有出色的语义理解能力,不仅能判断正误,还能感知回复的“质感”,对主观体验的优劣具备敏锐且准确的辨别能力。
4. 反馈沟通:表达清晰、客观,能够准确描述评测过程中遇到的标准争议,并及时反馈,确保信息传达准确无误。
5. 工作态度:细致沉稳,能够适应重复性较强的评估任务,并在长期工作中保持专注与高效输出。
6. 加分项(在满足基本条件基础上):
a. 领域背景:具备代码、医疗、金融、命理星象等领域专业知识者优先;
b. 大模型经验:有大模型(LLM)或图生文(VLM)相关标注经验者优先;
c. 多模态经验:具备文生图(Text-to-Image)或文生视频(Text-to-Video)相关评估或评分经验者优先。
岗位职责:
1. 模型输出评分:负责对VLM(视觉语言模型)图生文结果进行质量评估,围绕逻辑准确性、事实一致性、是否存在幻觉等维度进行精准打分与判定。
2. 评测集构建:协助业务团队搭建多模态评测题库,包括收集或筛选特定场景图片,并依据业务需求撰写高质量、具区分度的Prompt(提示词)。
3. 逻辑与理解审核:在评测过程中,准确识别模型在逻辑推理和语义理解方面的表现,发现回复中存在的细微逻辑问题或语义偏差。
4. 主观体验审核:从用户角度出发,对模型生成内容的整体质量进行“主观好坏”评判,评估其是否自然流畅、贴合语境,以及是否符合人类的语言习惯与审美标准。
5. 问题整理与反馈:系统收集并归类评测中出现的典型错误案例(Badcase),详细记录并提交给项目负责人,协助汇总优化建议(无需直接对接研发人员)。
6. 标准执行与对齐:快速掌握并严格执行评测标准流程(SOP),确保在持续任务中评分结果的一致性与严谨性。
2026-02-24 14:36
IP属地:北京
职位福利
本科3-5年模型输出打分视觉语言模型

博彦科技(深圳)有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










