职位详情
职位描述:
1、承担大语言模型输出内容的质量评估任务,结合业务目标、模型能力范围及产品实际需求,设计并持续迭代优化评估体系、评判标准与执行流程。
2、深度掌握国内外AI产品与模型的表现特点,针对核心竞品实施系统性测评,涵盖内容质量、指令遵循等关键维度,产出具有洞察力的分析结果与报告,支撑模型迭代与产品策略制定。
3、主导人工评估项目的全周期管理,包括需求对接、方案规划、执行管控、质量核查、结果复盘与经验归档,提升评估任务的交付效率与结果可靠性。
4、基于评测数据开展深入分析,定位模型能力瓶颈、用户体验痛点及与竞品的差异,提炼核心发现,提出可执行的改进建议,并推动问题有效解决。
职位要求:
专业能力
1、须具备AI模型评估、内容质量评测、策略类评测等相关项目实践经验,有完整竞品分析经历者优先;具备小红书、腾讯、阿里、Kimi、科大讯飞等企业相关团队或项目背景者更佳
2、对文本内容质量具备敏锐判断力,拥有良好的文字感知能力,能准确识别并解析多种文体下的生成缺陷
3、具备扎实的数据分析功底,熟练运用Excel等工具进行数据处理、趋势分析与结论归纳,善于从评估数据中捕捉异常并输出结构化分析成果
4、具备较强的项目推动力,能够与产品、研发、数据等多方团队高效协作,保障多线程任务顺利落地
5、对大语言模型、AIGC应用及行业发展保持高度关注,了解Prompt Engineering、流程自动化设计、自动评测技术者优先考虑
背景要求:
1、本科及以上学历,毕业于双一流或QS200高校者优先,硕士学历优先
2、具备2-5年相关领域工作经验;若拥有扎实的AI模型评测背景,尤其在方案设计与项目管理方面有实绩者,学历和工作年限可适度放宽
3、本岗位非单纯执行岗,期望候选人具备出色的逻辑思维、统筹协调、问题拆解与结果导向意识
4、思维开放,适应性强,学习能力突出,对AI在内容生成领域的应用及模型进化保持强烈兴趣;沟通表达清晰,工作细致认真,责任心强
1、承担大语言模型输出内容的质量评估任务,结合业务目标、模型能力范围及产品实际需求,设计并持续迭代优化评估体系、评判标准与执行流程。
2、深度掌握国内外AI产品与模型的表现特点,针对核心竞品实施系统性测评,涵盖内容质量、指令遵循等关键维度,产出具有洞察力的分析结果与报告,支撑模型迭代与产品策略制定。
3、主导人工评估项目的全周期管理,包括需求对接、方案规划、执行管控、质量核查、结果复盘与经验归档,提升评估任务的交付效率与结果可靠性。
4、基于评测数据开展深入分析,定位模型能力瓶颈、用户体验痛点及与竞品的差异,提炼核心发现,提出可执行的改进建议,并推动问题有效解决。
职位要求:
专业能力
1、须具备AI模型评估、内容质量评测、策略类评测等相关项目实践经验,有完整竞品分析经历者优先;具备小红书、腾讯、阿里、Kimi、科大讯飞等企业相关团队或项目背景者更佳
2、对文本内容质量具备敏锐判断力,拥有良好的文字感知能力,能准确识别并解析多种文体下的生成缺陷
3、具备扎实的数据分析功底,熟练运用Excel等工具进行数据处理、趋势分析与结论归纳,善于从评估数据中捕捉异常并输出结构化分析成果
4、具备较强的项目推动力,能够与产品、研发、数据等多方团队高效协作,保障多线程任务顺利落地
5、对大语言模型、AIGC应用及行业发展保持高度关注,了解Prompt Engineering、流程自动化设计、自动评测技术者优先考虑
背景要求:
1、本科及以上学历,毕业于双一流或QS200高校者优先,硕士学历优先
2、具备2-5年相关领域工作经验;若拥有扎实的AI模型评测背景,尤其在方案设计与项目管理方面有实绩者,学历和工作年限可适度放宽
3、本岗位非单纯执行岗,期望候选人具备出色的逻辑思维、统筹协调、问题拆解与结果导向意识
4、思维开放,适应性强,学习能力突出,对AI在内容生成领域的应用及模型进化保持强烈兴趣;沟通表达清晰,工作细致认真,责任心强
2026-05-11 15:03
IP属地:北京
职位福利
本科3-5年AI模型评测内容评测策略评测

中电金信软件有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









