职位详情
● 计算机科学、软件工程或人工智能等相关专业背景。
● 精通 Python 与 JavaScript,具备扎实的编程功底和工程实践能力,可独立完成技术问题的分析与解决。
● 掌握主流模型评测数据集(HumanEval、SWE-Bench、τ²-Bench、GAIA 等)的应用场景与使用方法。
● 熟悉模型评估指标的设计逻辑及结果分析方式(如准确率、通过率、BLEU、******、代码执行率等)。
● 具有较强的数据分析意识,能基于数据输出有效的分析判断与结论。
● 拥有良好的技术文档编写能力,能够清晰展示模型性能的发展变化趋势。
● 精通 Python 与 JavaScript,具备扎实的编程功底和工程实践能力,可独立完成技术问题的分析与解决。
● 掌握主流模型评测数据集(HumanEval、SWE-Bench、τ²-Bench、GAIA 等)的应用场景与使用方法。
● 熟悉模型评估指标的设计逻辑及结果分析方式(如准确率、通过率、BLEU、******、代码执行率等)。
● 具有较强的数据分析意识,能基于数据输出有效的分析判断与结论。
● 拥有良好的技术文档编写能力,能够清晰展示模型性能的发展变化趋势。
2026-06-11 13:31
IP属地:北京
职位福利
本科1-3年GAIA大模型SWE-BenchHumanEvalPython

北京联和利泰科技股份有限公司
不需要融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










