职位详情
工作职责:
1. 熟悉系统核心业务数据流程,构建适用于业务场景的大模型训练数据集;
2. 深入理解临床领域大模型判断逻辑、AI交互对话及Prompt优化等应用情境,设计相应测试用例;
3. 验证业务在大模型环境下的功能实现、准确率、响应性能与系统稳定性,并输出基准评估指标;
4. 根据实际业务需求生成有效Prompt,结合大模型输出结果进行准确性验证、覆盖度分析及测试报告撰写;
5. 从大模型落地应用场景出发,协同AI算法团队共同搭建和完善AI方向的测试体系;
能力匹配:
1. 熟悉主流模型如Qwen、DeepSeek的测试框架,掌握大模型相关测试方法论;
2. 具备快速排查和解决实际问题的能力,能够对Python代码逻辑进行审查与实现分析;
3. 能够设计检索增强生成(RAG)系统的测试方案,并校验知识库内容的完整性和一致性;
4. 精通Prompt提示词工程的验证策略与设计方法;
5. 可面向具体业务系统构建适配大模型运行的数据集,设计业务对话中的边界测试案例;
6. 掌握Dify、Coze等工作流编排工具,具备Agent相关测试实践经验者优先;
7. 具备多模态测试经验,能对多模态场景下的边界情况、内容准确性及泛化能力进行评估者更佳;
8. 熟练使用Python或Java至少一种开发语言,熟悉Jmeter、Locust等常用测试工具;
9. 学习能力强,自我驱动,善于沟通协作,性格坚韧乐观,具备良好的团队合作意识;
1. 熟悉系统核心业务数据流程,构建适用于业务场景的大模型训练数据集;
2. 深入理解临床领域大模型判断逻辑、AI交互对话及Prompt优化等应用情境,设计相应测试用例;
3. 验证业务在大模型环境下的功能实现、准确率、响应性能与系统稳定性,并输出基准评估指标;
4. 根据实际业务需求生成有效Prompt,结合大模型输出结果进行准确性验证、覆盖度分析及测试报告撰写;
5. 从大模型落地应用场景出发,协同AI算法团队共同搭建和完善AI方向的测试体系;
能力匹配:
1. 熟悉主流模型如Qwen、DeepSeek的测试框架,掌握大模型相关测试方法论;
2. 具备快速排查和解决实际问题的能力,能够对Python代码逻辑进行审查与实现分析;
3. 能够设计检索增强生成(RAG)系统的测试方案,并校验知识库内容的完整性和一致性;
4. 精通Prompt提示词工程的验证策略与设计方法;
5. 可面向具体业务系统构建适配大模型运行的数据集,设计业务对话中的边界测试案例;
6. 掌握Dify、Coze等工作流编排工具,具备Agent相关测试实践经验者优先;
7. 具备多模态测试经验,能对多模态场景下的边界情况、内容准确性及泛化能力进行评估者更佳;
8. 熟练使用Python或Java至少一种开发语言,熟悉Jmeter、Locust等常用测试工具;
9. 学习能力强,自我驱动,善于沟通协作,性格坚韧乐观,具备良好的团队合作意识;
2026-06-27 14:29
IP属地:浙江杭州
职位福利
本科5-10年自动化测试经验测试工作经验自动化测试MySQLAI,Prompt,大模型计算机相关专业JMeter软件开发经验Python

杭州璞睿生命科技有限公司
A轮 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










