职位详情
岗位要求:
● 本科及以上学历,专业不限,表现优异的大专学历者亦可考虑
● 具备较强的文字理解与表达能力,逻辑思维清楚,善于换位思考,拥有良好的用户意识
● 工作态度严谨、细致踏实,责任心强,具备出色的执行能力和团队合作意识,能严格执行评测规范与操作流程
● 掌握基础的计算机操作技能,熟练运用常用办公软件(如Excel、Word),有数据标注或模型评估相关经验者优先考虑
● 对人工智能及大语言模型领域具有浓厚兴趣,长期使用主流AI工具,并具备一定的认知积累与独立思考;熟悉大模型的基本技术原理和架构体系
岗位职责:
● 承担大语言模型(LLM)各项通用能力的初级评测任务,涵盖文本生成、逻辑推理、知识问答、多轮对话、代码生成等核心应用场景的效果评估工作
● 依据既定的评测标准与流程,对模型输出内容进行公正、精准的评分与标注,记录评测中发现的异常现象与模型缺陷,形成完整详实的评测日志
● 参与自动化评估集的建设,完成测试题目的设计、考查点说明撰写以及评分规则制定等相关工作
● 协助开展评测数据集的整理、清洗与标注任务,提升样本覆盖范围与代表性,持续优化数据质量
● 配合团队推进评测工作的实施,及时汇报评测过程中出现的问题(如标准不明确、样本异常等),共同参与评测策略与流程的改进优化
● 本科及以上学历,专业不限,表现优异的大专学历者亦可考虑
● 具备较强的文字理解与表达能力,逻辑思维清楚,善于换位思考,拥有良好的用户意识
● 工作态度严谨、细致踏实,责任心强,具备出色的执行能力和团队合作意识,能严格执行评测规范与操作流程
● 掌握基础的计算机操作技能,熟练运用常用办公软件(如Excel、Word),有数据标注或模型评估相关经验者优先考虑
● 对人工智能及大语言模型领域具有浓厚兴趣,长期使用主流AI工具,并具备一定的认知积累与独立思考;熟悉大模型的基本技术原理和架构体系
岗位职责:
● 承担大语言模型(LLM)各项通用能力的初级评测任务,涵盖文本生成、逻辑推理、知识问答、多轮对话、代码生成等核心应用场景的效果评估工作
● 依据既定的评测标准与流程,对模型输出内容进行公正、精准的评分与标注,记录评测中发现的异常现象与模型缺陷,形成完整详实的评测日志
● 参与自动化评估集的建设,完成测试题目的设计、考查点说明撰写以及评分规则制定等相关工作
● 协助开展评测数据集的整理、清洗与标注任务,提升样本覆盖范围与代表性,持续优化数据质量
● 配合团队推进评测工作的实施,及时汇报评测过程中出现的问题(如标准不明确、样本异常等),共同参与评测策略与流程的改进优化
2026-02-24 14:28
IP属地:四川成都
职位福利
大专1-3年问答对话大模型搜索LLM字节百度

博彦科技(深圳)有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
视频字幕大模型标注(五险一金+周末双休)
5000-6000元/月
数据标注/AI训练师经验不限大专视频标注CAPTION标注数据质量把控标注流程优化
成都 武侯区
数据标注专员-AI医疗项目评估
1.1-1.5万元/月
数据标注/AI训练师1-3年本科临床数据分析CTACRCCRAⅢ期Ⅳ期内科研究呼吸内科研究消化内科研究外科研究心脏外科研究
成都 武侯区

杨先生 · 中电金信今日活跃
AI数据标注/模型训练师
4000-6000元/月
数据标注/AI训练师1-3年大专标注结果整理视频标注标注数据分析数据分析能力强标注结果抽查描点标注标注方法优化区域标注标框标注分类标注
成都 武侯区

曹女士 · 金慧融智5日内活跃









