职位详情
岗位要求:
● 本科及以上学历,专业不限。
● 具备较强的文字理解与表达能力,思维逻辑清晰,富有同理心,能够从用户角度出发思考问题。
● 工作态度严谨细致,责任心强,具备良好的执行力和团队合作意识,能严格执行既定的评测规范与流程。
● 掌握基础计算机操作技能,熟练运用常用办公软件(如Excel、Word),有数据标注或模型评估相关经验者优先考虑。
● 对人工智能及大语言模型领域具备一定兴趣,长期使用主流AI工具,并形成个人理解与观点;熟悉大模型的基本原理与技术架构。
岗位职责:
● 承担大语言模型(LLM)各项通用能力的初级评测任务,涵盖文本生成、逻辑推理、知识问答、多轮对话、代码生成等核心应用场景的效果评估。
● 依据既定评测标准与流程,对模型输出内容进行准确、客观的评分与标注,记录评测中发现的异常现象与模型缺陷,形成完整的评测日志。
● 参与自动评估集的建设工作,负责题目设计、考点说明撰写、打分规则制定等相关任务。
● 参与评测数据集的整理、清洗与标注,协助提升样本覆盖范围与代表性,持续优化数据质量。
● 协同团队推进评测任务执行,及时反馈实际操作中的问题(如标准不明确、样本异常等),助力评测方案与流程的改进完善。
● 本科及以上学历,专业不限。
● 具备较强的文字理解与表达能力,思维逻辑清晰,富有同理心,能够从用户角度出发思考问题。
● 工作态度严谨细致,责任心强,具备良好的执行力和团队合作意识,能严格执行既定的评测规范与流程。
● 掌握基础计算机操作技能,熟练运用常用办公软件(如Excel、Word),有数据标注或模型评估相关经验者优先考虑。
● 对人工智能及大语言模型领域具备一定兴趣,长期使用主流AI工具,并形成个人理解与观点;熟悉大模型的基本原理与技术架构。
岗位职责:
● 承担大语言模型(LLM)各项通用能力的初级评测任务,涵盖文本生成、逻辑推理、知识问答、多轮对话、代码生成等核心应用场景的效果评估。
● 依据既定评测标准与流程,对模型输出内容进行准确、客观的评分与标注,记录评测中发现的异常现象与模型缺陷,形成完整的评测日志。
● 参与自动评估集的建设工作,负责题目设计、考点说明撰写、打分规则制定等相关任务。
● 参与评测数据集的整理、清洗与标注,协助提升样本覆盖范围与代表性,持续优化数据质量。
● 协同团队推进评测任务执行,及时反馈实际操作中的问题(如标准不明确、样本异常等),助力评测方案与流程的改进完善。
2026-05-27 14:23
IP属地:四川成都
职位福利
本科1-3年

深圳市腾讯计算机系统有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
数据标注/AI训练师
6000-8000元/月
数据标注/AI训练师1-3年本科数据标注语音标注标注结果整理视频标注数据分析能力强标注结果抽查区域标注英语CET6图片标注检索文本标注多跳推理标注数据分析描点标注标注方法优化标框标注分类标注豆包大模
成都 武侯区

杜女士 · 成都热热科技有限公司5日内活跃
AI播音主持/直播/配音/录音(内容标注与评测)
6000-11000元/月
数据标注/AI训练师1-3年本科ProtoolsWaves插件音效设计录音/混音AI语音合成标注评测TTS
成都 武侯区

戴女士 · 软通动力5日内活跃









