搜索
登录注册

职位详情

岗位职责:
1、参与基础大模型及 Agent 应用评测体系的构建与持续优化,建立高标准的评估机制,支撑大模型能力迭代升级;
2、参与评测数据集与 BenchMark 的设计与维护,搭建评测环境,开发评测工具,实现评测报告的自动化生成,全面提升评测流程效率;

任职要求:
● 计算机科学、软件工程或人工智能等相关专业背景。
● 精通 Python 和 JavaScript,具备扎实的编程功底和工程实践能力,能独立完成技术问题分析与解决。
● 了解主流模型评测数据集(HumanEval、SWE-Bench、τ²-Bench、GAIA 等)。
● 掌握模型评测指标的设计逻辑与结果分析方法(准确率、通过率、BLEU、******、代码执行率等)。
● 具备较强的数据分析意识,能从数据中提炼有效结论并指导优化方向。
● 具备良好的技术文档编写能力,可清晰表达模型性能变化趋势与评估结果。
2026-06-11 13:17
IP属地:北京

职位福利

本科1-3年pythonagentjsbenchmark
企业发布信息图
北京联和利泰科技股份有限公司
不需要融资 · 1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

大模型算法研发工程师
2-4万元/月
大模型算法3-5年硕士
北京 海淀区
AI大模型开发工程师(银行方向)
2.1-2.5万元/月
大模型算法10年以上学历不限
北京 海淀区
大模型算法研发工程师
2.5-4万元/月
大模型算法3-5年硕士自然语言处理建筑大模型AGENT图像算法多模态算法
北京 海淀区
先生 · 广联达5日内活跃
大模型应用算法组长(军工)
4-5万元/月
大模型算法5-10年硕士sft/dpo/grpo军工大模型后训自动化评测基线智能体(Agent)研发
北京 海淀区
智能体开发工程师(大唐软件项目外包)
1.8-2万元/月
大模型算法5-10年本科
北京 海淀区
大模型推理框架
8-8.5万元/月
大模型算法5-10年硕士
北京 海淀区
智能体开发工程师-大唐软件(外包)
1.8-2万元/月
大模型算法3-5年本科python
北京 海淀区
技术岗(大模型领域)
1.7-2.3万元/月
大模型算法1-3年硕士大模型
北京 海淀区
大模型应用开发工程师(需长期外派)
1.5-3万元/月
大模型算法经验不限本科计算机相关专业
北京 海淀区
大模型开发平台技术专家
2-4万元/月
大模型算法5-10年本科python大模型训练
北京 海淀区