职位详情
1.构建并优化大模型评估体系,结合不同业务场景与应用目标,设计定制化的评测方案与策略,确保评估结果能真实体现模型在实际环境中的性能表现;
2.对候选大模型开展全面的性能测评,涵盖语言理解、文本生成、图像识别准确率等核心能力,输出系统性对比分析报告;
3.参与AI产品的需求调研与分析,为模型训练方向提供专业建议和技术支持;
4.搭建并持续维护高质量评测数据集,完成数据清洗与预处理工作,保障数据准确性与代表性,支撑可靠的模型评估流程;
5.运用AI技术开发自动化评估工具,推动实现端到端的CI/CT测试流程标准化与高效化。
岗位要求:
1.教育背景:计算机科学、人工智能、数学、软件工程或相关领域硕士及以上学历;
2.具备大模型测试开发与评估相关经验,熟悉大模型训练、评测及应用场景者优先;
3.掌握扎实的算法基础,如强化学习、对抗学习等相关技术;
4.熟练使用Python/C++,具备PyTorch或TensorFlow项目实战经验;
5.具备良好的前瞻思维和自主学习能力,可独立研读前沿技术文献与研究报告,并产出高质量技术分析成果。
【加分项】
具有AI模型服务化开发、效果评估与体验优化、算法研究等相关经验者优先;
具备DevOps实践经验者更佳。
2.对候选大模型开展全面的性能测评,涵盖语言理解、文本生成、图像识别准确率等核心能力,输出系统性对比分析报告;
3.参与AI产品的需求调研与分析,为模型训练方向提供专业建议和技术支持;
4.搭建并持续维护高质量评测数据集,完成数据清洗与预处理工作,保障数据准确性与代表性,支撑可靠的模型评估流程;
5.运用AI技术开发自动化评估工具,推动实现端到端的CI/CT测试流程标准化与高效化。
岗位要求:
1.教育背景:计算机科学、人工智能、数学、软件工程或相关领域硕士及以上学历;
2.具备大模型测试开发与评估相关经验,熟悉大模型训练、评测及应用场景者优先;
3.掌握扎实的算法基础,如强化学习、对抗学习等相关技术;
4.熟练使用Python/C++,具备PyTorch或TensorFlow项目实战经验;
5.具备良好的前瞻思维和自主学习能力,可独立研读前沿技术文献与研究报告,并产出高质量技术分析成果。
【加分项】
具有AI模型服务化开发、效果评估与体验优化、算法研究等相关经验者优先;
具备DevOps实践经验者更佳。
2026-06-24 12:59
IP属地:北京
职位福利
硕士3-5年自动化测试PostmanPython

北京理想汽车有限公司
1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









