大模型评估工程师

3.5-5万元/月

顺义区

北京理想汽车有限公司

职位详情

1.构建并优化大模型评估体系，结合不同业务场景与应用目标，设计定制化的评测方案与策略，确保评估结果能真实体现模型在实际环境中的性能表现；
2.对候选大模型开展全面的性能测评，涵盖语言理解、文本生成、图像识别准确率等核心能力，输出系统性对比分析报告；
3.参与AI产品的需求调研与分析，为模型训练方向提供专业建议和技术支持；
4.搭建并持续维护高质量评测数据集，完成数据清洗与预处理工作，保障数据准确性与代表性，支撑可靠的模型评估流程；
5.运用AI技术开发自动化评估工具，推动实现端到端的CI/CT测试流程标准化与高效化。

岗位要求：
1.教育背景：计算机科学、人工智能、数学、软件工程或相关领域硕士及以上学历；
2.具备大模型测试开发与评估相关经验，熟悉大模型训练、评测及应用场景者优先；
3.掌握扎实的算法基础，如强化学习、对抗学习等相关技术；
4.熟练使用Python/C++，具备PyTorch或TensorFlow项目实战经验；
5.具备良好的前瞻思维和自主学习能力，可独立研读前沿技术文献与研究报告，并产出高质量技术分析成果。

【加分项】
具有AI模型服务化开发、效果评估与体验优化、算法研究等相关经验者优先；
具备DevOps实践经验者更佳。

2026-06-29 14:04

IP属地：北京

职位福利

硕士3-5年自动化测试PostmanPython

企业发布信息图

北京理想汽车有限公司

工作地址

北京顺义区理想汽车研发总部C区理想汽车总部

鱼泡安全保障

如遇到办证收费、刷单、传销、诱导买车等违规行为，请立即向鱼泡直聘投诉举报投诉举报 >

下载鱼泡直聘APP

附近适合您的职位

高级测试开发工程师/资深专家

3-4万元/月

测试开发5-10年本科自动化测试经验Java测试工作经验iOS/Android测试经验自动化测试压力测试计算机相关专业软件开发经验Python

北京海淀区

肖先生 · 北京短剧快照科技

测开

1.6-1.8万元/月

测试开发3-5年本科Linux教育测开客户端Python

北京昌平区

李女士 · 迅达在线（天津）科技有限公司

高级测试开发工程师/资深专家

3-6万元/月

测试开发经验不限本科自动化测试经验Java测试工作经验iOS/Android测试经验自动化测试性能测试MySQL功能测试计算机相关专业掌握软件测试理论和流程

北京朝阳区

林先生 · 阿里巴巴国际事业部

测试开发

1.3-1.7万元/月

测试开发3-5年本科linux硬件

北京昌平区

李女士 · 迅达在线（天津）科技有限公司

测试开发专家

2-3.5万元/月

测试开发3-5年本科自动化测试经验Java测试工作经验自动化测试通信相关专业支付功能测试计算机相关专业掌握软件测试理论和流程

北京西城区

章先生 · 天翼电子商务有限公司

数据测试具备数据采集调度或大数据背景经验丰富

1.3-1.4万元/月

测试开发3-5年本科自动化测试性能测试数据测试LoadRunnerJMeter大数据

北京朝阳区

唐先生 · 睿服科技

测试开发（知名厂商）

1.5-1.7万元/月

测试开发5-10年本科自动化测试经验大厂JavaiOS/Android测试经验自动化测试性能测试功能测试京东软件开发经验Python电商

北京大兴区

王女士 · 汉克时代

数据测试具备数据采集调度或大数据项目经验优

1.3-1.4万元/月

测试开发3-5年本科自动化测试性能测试数据测试LoadRunnerJMeter大数据

北京朝阳区

唐先生 · 睿服科技

测试开发

1.8-3.5万元/月

测试开发3-5年本科Java自动化测试MySQL功能测试

北京朝阳区

汪先生 · 网商银行

收藏职位