职位详情
职位描述
1、参与大语言模型生成内容的质量评估工作,结合业务目标、模型能力范围及产品实际需求,设计并迭代优化评估体系、评判标准与执行流程。
2、深度洞察国内外AI产品与模型的技术表现,针对核心竞品开展系统性测评,涵盖内容质量、指令理解等关键维度,输出具有深度洞察的分析结果与报告,支撑模型迭代与产品策略制定。
3、主导人工评估项目的全流程管理,包括需求对接、方案规划、执行监督、质量核查、结果复盘与经验沉淀,提升评估任务的交付效率与结果可靠性。
4、基于评估数据进行深入分析,定位模型能力瓶颈、用户体验痛点及与竞品的差异,提炼核心发现,提出可执行的改进建议,并推动问题有效解决。
职位要求
专业能力
1、需具备AI模型评估、内容质量评测或相关策略类项目经验,有成熟竞品分析实践者优先;如有小红书、腾讯、阿里、Kimi、科大讯飞等相关团队或项目背景更佳
2、对文本内容质量具备敏锐判断力,拥有良好的文字感知能力,能准确识别并解析不同文体下的生成缺陷
3、具备扎实的数据分析能力,熟练运用Excel等工具完成数据处理、趋势分析与结论归纳,善于从数据中发现关键问题,并输出结构化分析成果
4、具备较强的项目推动力,能够与产品、研发、数据等多方团队高效协作,保障多线程任务顺利落地
5、对大语言模型、AIGC应用及行业发展方向有浓厚兴趣和一定认知,掌握Prompt Engineering、流程自动化设计、自动评测方法者优先考虑
背景要求
1、本科及以上学历,毕业于双一流或QS200高校者优先,硕士学历优先
2、具备2-5年相关领域工作经验;若在AI模型评测方面经验丰富,且参与过评估方案设计与项目管理而非单纯执行,学历和年限可适度放宽
3、本岗位非基础执行岗,期望候选人具备较强逻辑思维、统筹协调能力、问题解决能力及结果导向意识
4、思维开放灵活,适应性强,学习能力突出,持续关注AI在内容生成领域的应用演进;沟通表达清晰,工作细致认真,富有责任心
1、参与大语言模型生成内容的质量评估工作,结合业务目标、模型能力范围及产品实际需求,设计并迭代优化评估体系、评判标准与执行流程。
2、深度洞察国内外AI产品与模型的技术表现,针对核心竞品开展系统性测评,涵盖内容质量、指令理解等关键维度,输出具有深度洞察的分析结果与报告,支撑模型迭代与产品策略制定。
3、主导人工评估项目的全流程管理,包括需求对接、方案规划、执行监督、质量核查、结果复盘与经验沉淀,提升评估任务的交付效率与结果可靠性。
4、基于评估数据进行深入分析,定位模型能力瓶颈、用户体验痛点及与竞品的差异,提炼核心发现,提出可执行的改进建议,并推动问题有效解决。
职位要求
专业能力
1、需具备AI模型评估、内容质量评测或相关策略类项目经验,有成熟竞品分析实践者优先;如有小红书、腾讯、阿里、Kimi、科大讯飞等相关团队或项目背景更佳
2、对文本内容质量具备敏锐判断力,拥有良好的文字感知能力,能准确识别并解析不同文体下的生成缺陷
3、具备扎实的数据分析能力,熟练运用Excel等工具完成数据处理、趋势分析与结论归纳,善于从数据中发现关键问题,并输出结构化分析成果
4、具备较强的项目推动力,能够与产品、研发、数据等多方团队高效协作,保障多线程任务顺利落地
5、对大语言模型、AIGC应用及行业发展方向有浓厚兴趣和一定认知,掌握Prompt Engineering、流程自动化设计、自动评测方法者优先考虑
背景要求
1、本科及以上学历,毕业于双一流或QS200高校者优先,硕士学历优先
2、具备2-5年相关领域工作经验;若在AI模型评测方面经验丰富,且参与过评估方案设计与项目管理而非单纯执行,学历和年限可适度放宽
3、本岗位非基础执行岗,期望候选人具备较强逻辑思维、统筹协调能力、问题解决能力及结果导向意识
4、思维开放灵活,适应性强,学习能力突出,持续关注AI在内容生成领域的应用演进;沟通表达清晰,工作细致认真,富有责任心
2026-05-09 11:44
IP属地:四川成都
职位福利
本科1-3年

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
视频数据标注专员
4000-7000元/月
数据标注/AI训练师1-3年大专不接受居家办公视频标注标框标注接受加班数据分析能力强标注方法优化标注结果抽查标注结果整理
成都 武侯区

梁女士 · 成都英顺世汀科技今日活跃
数据标注文员【具备标注或客服经验者优先】
4000-6000元/月
数据标注/AI训练师经验不限本科上市公司五险一金数据标注文本标注语音标注早9晚6周末双休视频标注图片标注分类标注
成都 武侯区

曹女士 · 金慧融智5日内活跃








