职位详情
岗位职责:
● 承担大语言模型(LLM)在文本生成、逻辑推理、知识问答、多轮对话、代码生成等主要应用场景下的实际效果评估工作,开展一线评测任务。
● 依据既定的评测规范与操作流程,对模型输出内容进行准确评分与标注,识别并记录模型表现中的异常现象与薄弱环节,形成完整的评测记录文档。
● 参与自动化评估体系的建设,承担测试题目设计、考查点说明撰写及评分规则制定等相关工作。
● 协助完成评测数据集的整理、清洗与标注任务,提升样本覆盖范围与代表性,保障评测数据的整体质量水平。
● 协同团队推进评测任务执行,及时汇报评测中发现的问题(如标准不明确、样本异常等),参与优化评测策略与实施流程。
岗位要求:
● 本科及以上学历,不限专业背景。
● 具备较强的文本理解与书面表达能力,思维条理清晰,拥有良好的共情能力和用户导向意识。
● 工作态度严谨细致,责任心强,具备出色的执行力和团队合作意识,能够严格执行评测规范与流程要求。
● 掌握基础计算机操作技能,可熟练运用常用办公软件(如Excel、Word),有数据标注或模型评估相关经验者优先考虑。
● 对人工智能技术特别是大语言模型领域具有浓厚兴趣,长期使用主流AI工具,并能提出个人理解与观点;熟悉大模型的基本技术原理与架构特点。
ps:
1、工作时间:9:00-18:00,周末双休
2、面试形式:两轮线上面试
3、全日制本科
4、人力外包岗位
● 承担大语言模型(LLM)在文本生成、逻辑推理、知识问答、多轮对话、代码生成等主要应用场景下的实际效果评估工作,开展一线评测任务。
● 依据既定的评测规范与操作流程,对模型输出内容进行准确评分与标注,识别并记录模型表现中的异常现象与薄弱环节,形成完整的评测记录文档。
● 参与自动化评估体系的建设,承担测试题目设计、考查点说明撰写及评分规则制定等相关工作。
● 协助完成评测数据集的整理、清洗与标注任务,提升样本覆盖范围与代表性,保障评测数据的整体质量水平。
● 协同团队推进评测任务执行,及时汇报评测中发现的问题(如标准不明确、样本异常等),参与优化评测策略与实施流程。
岗位要求:
● 本科及以上学历,不限专业背景。
● 具备较强的文本理解与书面表达能力,思维条理清晰,拥有良好的共情能力和用户导向意识。
● 工作态度严谨细致,责任心强,具备出色的执行力和团队合作意识,能够严格执行评测规范与流程要求。
● 掌握基础计算机操作技能,可熟练运用常用办公软件(如Excel、Word),有数据标注或模型评估相关经验者优先考虑。
● 对人工智能技术特别是大语言模型领域具有浓厚兴趣,长期使用主流AI工具,并能提出个人理解与观点;熟悉大模型的基本技术原理与架构特点。
ps:
1、工作时间:9:00-18:00,周末双休
2、面试形式:两轮线上面试
3、全日制本科
4、人力外包岗位
2026-01-31 09:18
IP属地:四川成都
职位福利
本科1年以下熟悉ai工具全日制本科内容创作经验

博彦科技(深圳)有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











