职位详情
职位描述:
1、负责多模态大模型的效果与质量评估工作,构建科学的评估标准与体系,并与产品、算法团队紧密协作,深入挖掘和理解评估需求;
2、运用数据分析等手段对问题进行结构化拆解,高效推进评估任务执行,输出分析结论,精准识别模型在各类使用场景中的体验短板;
3、具备计算机相关技术背景,可独立完成API接口对接及平台侧工程化开发任务;
4、参与多样化业务调研与分析,结合行业主流模型表现与业务预期,针对具体场景探索智能化、高效率的模型评估方法,主导评估模型与工具的设计与落地。
职位要求:
1、学历/院校要求:本科及以上学历,硕士或985/211高校背景优先考虑;
2、专业要求:统计学、数学、计算机、心理学等理工类相关专业,具备扎实的数理统计基础者优先,逻辑思维能力强,能对复杂业务逻辑进行有效抽象与分解;
3、有大模型评测或代码类产品的实践经验者优先,熟悉深度学习与大模型理论者优先;
4、掌握编程及数据结构基础知识,熟练使用C++或Python语言,在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等技术竞赛中取得奖项者优先;
5、具备一定项目管理能力,善于跨团队沟通协作,拥有较强的问题解决与推动能力,责任心强,学习能力、沟通能力和自我驱动力突出,能够快速响应并落实工作任务;
6、在大模型训练或垂直领域有深厚积累或实战经验,具备优秀的归纳总结与文档输出能力,综合素质高,具备反向赋能团队的能力。
1、负责多模态大模型的效果与质量评估工作,构建科学的评估标准与体系,并与产品、算法团队紧密协作,深入挖掘和理解评估需求;
2、运用数据分析等手段对问题进行结构化拆解,高效推进评估任务执行,输出分析结论,精准识别模型在各类使用场景中的体验短板;
3、具备计算机相关技术背景,可独立完成API接口对接及平台侧工程化开发任务;
4、参与多样化业务调研与分析,结合行业主流模型表现与业务预期,针对具体场景探索智能化、高效率的模型评估方法,主导评估模型与工具的设计与落地。
职位要求:
1、学历/院校要求:本科及以上学历,硕士或985/211高校背景优先考虑;
2、专业要求:统计学、数学、计算机、心理学等理工类相关专业,具备扎实的数理统计基础者优先,逻辑思维能力强,能对复杂业务逻辑进行有效抽象与分解;
3、有大模型评测或代码类产品的实践经验者优先,熟悉深度学习与大模型理论者优先;
4、掌握编程及数据结构基础知识,熟练使用C++或Python语言,在ACM/ICPC、NOI/IOI、Top Coder、Kaggle等技术竞赛中取得奖项者优先;
5、具备一定项目管理能力,善于跨团队沟通协作,拥有较强的问题解决与推动能力,责任心强,学习能力、沟通能力和自我驱动力突出,能够快速响应并落实工作任务;
6、在大模型训练或垂直领域有深厚积累或实战经验,具备优秀的归纳总结与文档输出能力,综合素质高,具备反向赋能团队的能力。
2026-05-19 14:52
IP属地:北京
职位福利
本科经验不限图像标注语音标注音频标注视频标注文本标注

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












