职位详情
1. 针对多模态大模型(尤其是视觉相关能力,如图文理解、视觉问答、图像生成、目标检测等)设计并执行系统性测试方案,包括功能、精度、鲁棒性、泛化性、一致性及安全性等维度;
2. 构建和维护面向大模型的自动化测试框架与评估体系,支持大规模数据集验证、Prompt 测试、对抗样本测试、长尾场景覆盖等;
3. 负责视觉大模型 SDK/API 的端到端测试,包括接口规范、性能(吞吐/延迟)、资源占用、跨平台兼容性及异常处理能力;
4. 深度参与模型迭代过程,推动算法缺陷的定位、复现与修复闭环,协同算法、产品、工程团队高效落地;
5. 分析用户反馈与线上问题,构建回归测试集,持续优化测试覆盖率与评估指标(如准确率、F1、mAP、CLIP Score、Human Preference Alignment 等);
6. 探索前沿的大模型评测方法,引入或自研测试工具,提升测试效率与智能化水平。
职位要求:
1. 计算机、软件工程、人工智能、数学、信息安全等相关专业,本科及以上学历,2年以上算法或AI系统测试经验;
2. 有大模型(LLM/VLM)或多模态模型测试经验者优先;熟悉主流视觉大模型(如 CLIP、BLIP、SAM、DINOv2、Qwen-VL、InternVL 等)者加分;
3. 扎实的编程能力,熟练掌握 Python,熟悉 Shell 脚本,具备良好的代码工程习惯;能独立开发测试脚本、数据处理工具或自动化流水线;
4. 熟悉软件测试全流程,了解 AI 模型评估方法(如精度、召回、AUC、BLEU、ROUGE、人工评估等),对 CV 任务(分类、检测、分割、OCR、生成等)有深入理解;
5. 具备快速学习能力与技术热情,能主动研究大模型特性(如上下文长度、Prompt 敏感性、幻觉问题)并设计针对性测试策略;
6. 优秀的沟通协调能力和团队协作精神,能与算法工程师高效对话,善于从用户视角发现模型潜在风险;
7. 有在百度、商汤、旷视、云天励飞、阿里通义、字节、腾讯混元等 AI 公司从事大模型或 CV 算法测试经验者优先。
2. 构建和维护面向大模型的自动化测试框架与评估体系,支持大规模数据集验证、Prompt 测试、对抗样本测试、长尾场景覆盖等;
3. 负责视觉大模型 SDK/API 的端到端测试,包括接口规范、性能(吞吐/延迟)、资源占用、跨平台兼容性及异常处理能力;
4. 深度参与模型迭代过程,推动算法缺陷的定位、复现与修复闭环,协同算法、产品、工程团队高效落地;
5. 分析用户反馈与线上问题,构建回归测试集,持续优化测试覆盖率与评估指标(如准确率、F1、mAP、CLIP Score、Human Preference Alignment 等);
6. 探索前沿的大模型评测方法,引入或自研测试工具,提升测试效率与智能化水平。
职位要求:
1. 计算机、软件工程、人工智能、数学、信息安全等相关专业,本科及以上学历,2年以上算法或AI系统测试经验;
2. 有大模型(LLM/VLM)或多模态模型测试经验者优先;熟悉主流视觉大模型(如 CLIP、BLIP、SAM、DINOv2、Qwen-VL、InternVL 等)者加分;
3. 扎实的编程能力,熟练掌握 Python,熟悉 Shell 脚本,具备良好的代码工程习惯;能独立开发测试脚本、数据处理工具或自动化流水线;
4. 熟悉软件测试全流程,了解 AI 模型评估方法(如精度、召回、AUC、BLEU、ROUGE、人工评估等),对 CV 任务(分类、检测、分割、OCR、生成等)有深入理解;
5. 具备快速学习能力与技术热情,能主动研究大模型特性(如上下文长度、Prompt 敏感性、幻觉问题)并设计针对性测试策略;
6. 优秀的沟通协调能力和团队协作精神,能与算法工程师高效对话,善于从用户视角发现模型潜在风险;
7. 有在百度、商汤、旷视、云天励飞、阿里通义、字节、腾讯混元等 AI 公司从事大模型或 CV 算法测试经验者优先。
2026-06-13 14:49
IP属地:山东
职位福利
本科3-5年PythonShell功能测试自动化测试测试工作经验

山东极视角科技股份有限公司
C轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








