职位详情
必须有AI项目经验,统招本科(优先计算机相关专业)
岗位要求:
1. 学历&年限:计算机/AI/数学等相关专业本科及以上学历;具备3年以上测试领域工作经验。
2. 专业深度:
(1)在大模型(LLM)、NLP、图像识别/CV、多模态或强化学习等方向中,至少掌握一类算法的评测实践能力;
(2)熟练运用标注质量评估指标(如准确率、召回率、F1分数、置信度校准)进行计算与结果分析;
(3)熟悉NLP/CV/多模态常用性能衡量标准(如Accuracy、Recall、F1、CIDEr、CLIP-Score等)。
3. 工程落地能力:精通Python语言,能独立完成测试工具及自动化框架开发(具备Pytest/Unittest/Playwright经验者优先)。
4. 综合素养与热情:
(1)具备较强的学习能力和钻研精神,沟通协作顺畅;关注产品质量与用户体验,善于发现问题并推动问题闭环解决;
(2)拥有良好的自我驱动力和进取意识,积极主动,擅长独立思考与复盘总结;
(3)持续关注AI大模型前沿进展,具备自主学习与创新探索的能力。
岗位职责:
1. 将大模型视为产品开展测试:覆盖从问答系统到智能Agent的全流程,设计测试用例、执行评测任务、跟踪核心指标,输出结论与分析报告。
2. 构建评测体系:搭建评测数据集、定义评估指标、开发配套工具,实现评测流程自动化、结果可视化。【核心职责】
3. 通过编码提升效率:使用Python开发脚本或平台,实现重复性评测任务的高效执行,降低团队人工投入。
4. 以用户视角发现痛点:深入体验产品流程,分析Bad Case,协同算法与产品团队推进问题闭环。
5. 跟进最新评测技术:如LLM-as-a-Judge、多模态评测基准、自动评估方法等,及时将可行方案引入实际工作。
6. 探索AI赋能测试:实践“用AI测试AI”的理念,研发智能测试助手,推动测试流程智能化升级。
岗位要求:
1. 学历&年限:计算机/AI/数学等相关专业本科及以上学历;具备3年以上测试领域工作经验。
2. 专业深度:
(1)在大模型(LLM)、NLP、图像识别/CV、多模态或强化学习等方向中,至少掌握一类算法的评测实践能力;
(2)熟练运用标注质量评估指标(如准确率、召回率、F1分数、置信度校准)进行计算与结果分析;
(3)熟悉NLP/CV/多模态常用性能衡量标准(如Accuracy、Recall、F1、CIDEr、CLIP-Score等)。
3. 工程落地能力:精通Python语言,能独立完成测试工具及自动化框架开发(具备Pytest/Unittest/Playwright经验者优先)。
4. 综合素养与热情:
(1)具备较强的学习能力和钻研精神,沟通协作顺畅;关注产品质量与用户体验,善于发现问题并推动问题闭环解决;
(2)拥有良好的自我驱动力和进取意识,积极主动,擅长独立思考与复盘总结;
(3)持续关注AI大模型前沿进展,具备自主学习与创新探索的能力。
岗位职责:
1. 将大模型视为产品开展测试:覆盖从问答系统到智能Agent的全流程,设计测试用例、执行评测任务、跟踪核心指标,输出结论与分析报告。
2. 构建评测体系:搭建评测数据集、定义评估指标、开发配套工具,实现评测流程自动化、结果可视化。【核心职责】
3. 通过编码提升效率:使用Python开发脚本或平台,实现重复性评测任务的高效执行,降低团队人工投入。
4. 以用户视角发现痛点:深入体验产品流程,分析Bad Case,协同算法与产品团队推进问题闭环。
5. 跟进最新评测技术:如LLM-as-a-Judge、多模态评测基准、自动评估方法等,及时将可行方案引入实际工作。
6. 探索AI赋能测试:实践“用AI测试AI”的理念,研发智能测试助手,推动测试流程智能化升级。
2026-05-12 13:34
IP属地:北京
职位福利
本科5-10年AI测试Python

北京联和利泰科技股份有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
测试开发工程师/专家(北京)
2.8-5.5万元/月
测试开发5-10年本科自动化测试经验测试工作经验自动化测试通信相关专业性能测试压力测试计算机相关专业Python
北京 海淀区

狄女士 · 嘉信恒泰5日内活跃
测试开发工程师(语音与融合通信)
1.5-2.5万元/月
测试开发3-5年本科Golang自动化测试经验Java测试工作经验通信相关专业性能测试计算机相关专业Python
北京 海淀区

崔女士 · 亚讯鸿达5日内活跃






