搜索
登录注册

职位详情

岗位职责:
1. 模型评测:制定并执行大模型的评估策略,涵盖性能、准确率、鲁棒性等方面的测试。采用多种评估标准(如F1分数、AUC、BLEU等)对模型进行系统性测评,确保其在多样化应用场景中的稳定性与可靠性。撰写完整的评测文档,记录测试流程与结果,输出优化建议。

2. 性能优化:基于评测数据定位模型短板,识别性能瓶颈,提出可行性改进方案。协同算法团队优化模型训练与推理流程,提升预测精度与响应效率。优化计算资源调度,保障大规模数据处理下的运行效能与成本可控。

3. 业务对接:与产品及业务团队密切协作,深入理解业务目标,确保评测体系贴合实际需求。为业务落地过程中的技术问题提供支持,输出专业解决方案,助力模型高效应用。

4. 技术调研:持续关注大模型领域前沿技术与评估方法,分析新兴技术的落地价值,为公司技术升级和创新方向提供参考建议。

5. 团队合作:积极与团队成员交流技术经验,推动知识共享,助力团队整体能力提升。协助同事攻克技术难点,促进项目顺利推进与个人共同发展。

任职要求:
● 教育背景:计算机科学、数学、统计学、人工智能等相关专业本科及以上学历。
● 工作经验:具备3年以上测试、AI模型评估或相关领域工作经验,有金融行业经历者优先考虑。
● 技术能力:熟练掌握Python、C++等编程语言,熟悉主流机器学习与深度学习框架(如TensorFlow、PyTorch等)。
○ 具备扎实的模型评测实践背景,精通常见评估指标与测评方法。
○ 熟悉大语言模型(如GPT、BERT等)的基本原理与典型应用场景,拥有实际评测经验。
● 专业知识:了解主流LLM、VLM评测体系,对业内常用Benchmark及测试集有一定认知。掌握机器学习理论,特别是深度学习与自然语言处理相关技术。熟悉数据清洗与分析流程,能够通过数据驱动方式支持算法团队完成模型调优。
● 解决问题能力:具备较强的逻辑思维与独立分析能力,善于从复杂场景中提炼核心问题。
● 团队合作:具备良好的协作意识,能与跨职能团队顺畅沟通,共同保障项目落地成效。
● 创新意识:对前沿技术保持敏锐洞察,勇于探索新技术,具备创新思维与实践动力。
2026-05-16 13:04
IP属地:北京

职位福利

本科3-5年
企业发布信息图
北京锋泰科技有限公司
1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

自动驾驶测试工程师
1.6-2万元/月
测试工程师3-5年本科
北京 朝阳区
测试开发工程师-催收领域 (MJ0007
2.5-5万元/月
测试工程师5-10年本科
北京 朝阳区
功能测试工程师
1.4-1.5万元/月
测试工程师3-5年本科资金和柜台账号经验金融经验
北京 朝阳区
测试工程师
1.2-1.3万元/月
测试工程师5-10年本科性能测试功能测试计算机相关专业
北京 朝阳区
测试工程师
1.4-1.8万元/月
测试工程师5-10年本科自动化测试计算机相关专业金融经验
北京 朝阳区
测试工程师
1-1.5万元/月
测试工程师经验不限大专
北京 朝阳区
测试工程师(财务会计领域)
1-1.5万元/月
测试工程师1-3年本科会计专业财务管理
北京 朝阳区
软件测试工程师
2-3万元/月
测试工程师大专
北京 朝阳区 望京
app测试懂SQL有证券或金融背景需到岗
1.2-1.8万元/月
测试工程师1-3年本科AppJava银行期货证券MySQL金融Python
北京 朝阳区
高级测试工程师
2-4万元/月
测试工程师经验不限本科
北京 朝阳区