职位详情
工作职责
1. 专注电商应用场景,对标行业领先技术标准,规划评测集核心方向,科学评估大模型表现,识别性能差距并明确迭代优化路径。
2. 主导数据生产全链路管理,搭建质量控制体系,确保评测集设计合理、标注准确,兼顾交付效率与成果品质。
3. 基于评测结果独立开展效果回溯与深入分析,输出高质量分析报告,为模型调优及业务策略提供有力数据支持。
4. 持续优化并维护数据生产与评测标准,推动标准在团队内统一落地与有效执行。
任职要求
1. 本科及以上学历,计算机、统计学、数学等相关专业优先考虑。
2. 具备电商平台工作经验或对垂直品类(如3C数码/服饰/美妆等)有深刻理解,掌握电商核心业务逻辑。
3. 熟悉数据清洗与解读方法,具备独立完成数据分析和报告撰写的能力,善于从数据中发现关键问题。
4. 对大模型技术应用有强烈兴趣,持续关注领域前沿动态,乐于探索AI在电商场景中的实际落地。
5. 符合以下任意一项者优先:
- 具备AI产品设计、数据构建、模型调优或评测集/Benchmark建设与运营经验;
- 有管理10人以上大模型数据生产团队的经历;
- 拥有评测运营、数据处理及结果复盘相关背景;
- 具备Agent设计、API调试能力,能通过评测集设定业务核心衡量指标。
6. 具备良好的沟通协作能力、抗压能力和复盘意识,执行力突出,能够快速响应业务变化需求。
1. 专注电商应用场景,对标行业领先技术标准,规划评测集核心方向,科学评估大模型表现,识别性能差距并明确迭代优化路径。
2. 主导数据生产全链路管理,搭建质量控制体系,确保评测集设计合理、标注准确,兼顾交付效率与成果品质。
3. 基于评测结果独立开展效果回溯与深入分析,输出高质量分析报告,为模型调优及业务策略提供有力数据支持。
4. 持续优化并维护数据生产与评测标准,推动标准在团队内统一落地与有效执行。
任职要求
1. 本科及以上学历,计算机、统计学、数学等相关专业优先考虑。
2. 具备电商平台工作经验或对垂直品类(如3C数码/服饰/美妆等)有深刻理解,掌握电商核心业务逻辑。
3. 熟悉数据清洗与解读方法,具备独立完成数据分析和报告撰写的能力,善于从数据中发现关键问题。
4. 对大模型技术应用有强烈兴趣,持续关注领域前沿动态,乐于探索AI在电商场景中的实际落地。
5. 符合以下任意一项者优先:
- 具备AI产品设计、数据构建、模型调优或评测集/Benchmark建设与运营经验;
- 有管理10人以上大模型数据生产团队的经历;
- 拥有评测运营、数据处理及结果复盘相关背景;
- 具备Agent设计、API调试能力,能通过评测集设定业务核心衡量指标。
6. 具备良好的沟通协作能力、抗压能力和复盘意识,执行力突出,能够快速响应业务变化需求。
2026-06-17 13:55
IP属地:北京
职位福利
本科经验不限大模型评测集设计电商场景AI落地数据分析与复盘

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










