职位详情
工作职责:
1. 熟悉系统核心业务数据流转,构建适用于AI大模型在实际业务场景中的训练与测试数据集;
2. 深入理解临床领域大模型判断逻辑、AI交互流程及Prompt优化需求,设计针对性测试用例;
3. 验证业务在大模型架构下的功能实现、结果准确率、响应性能和系统稳定性,并输出基准评估指标;
4. 根据具体业务场景生成有效Prompt指令,结合大模型输出进行准确性验证、覆盖度分析及测试报告撰写;
5. 从大模型应用的业务切入点出发,协同AI算法团队共同搭建和完善AI相关测试体系;
能力匹配:
1. 熟悉主流大模型如Qwen、DeepSeek等的测试框架,掌握大模型特有的测试方法论;
2. 具备快速排查与解决技术问题的能力,能对Python代码逻辑进行审查并理解其实现机制;
3. 能够为检索增强生成(RAG)系统设计测试用例,验证知识库内容的一致性与完整性;
4. 精通Prompt工程的验证策略与设计方法,具备系统化设计经验;
5. 可基于业务系统构建适配大模型运行的场景化数据集,设计业务对话中的边界案例;
6. 掌握Dify、Coze等工作流编排工具,具备Agent类项目的测试实践经验者优先;
7. 拥有多模态测试经验,能够对多模态场景下的边界情况、内容理解与泛化能力进行评估者更佳;
8. 熟练使用至少一种开发语言如Python或Java,熟悉Jmeter、Locust等常用性能测试工具;
9. 学习能力强,具备自我驱动力,沟通顺畅,思维敏捷,抗压性强,积极乐观,富有团队协作精神。
1. 熟悉系统核心业务数据流转,构建适用于AI大模型在实际业务场景中的训练与测试数据集;
2. 深入理解临床领域大模型判断逻辑、AI交互流程及Prompt优化需求,设计针对性测试用例;
3. 验证业务在大模型架构下的功能实现、结果准确率、响应性能和系统稳定性,并输出基准评估指标;
4. 根据具体业务场景生成有效Prompt指令,结合大模型输出进行准确性验证、覆盖度分析及测试报告撰写;
5. 从大模型应用的业务切入点出发,协同AI算法团队共同搭建和完善AI相关测试体系;
能力匹配:
1. 熟悉主流大模型如Qwen、DeepSeek等的测试框架,掌握大模型特有的测试方法论;
2. 具备快速排查与解决技术问题的能力,能对Python代码逻辑进行审查并理解其实现机制;
3. 能够为检索增强生成(RAG)系统设计测试用例,验证知识库内容的一致性与完整性;
4. 精通Prompt工程的验证策略与设计方法,具备系统化设计经验;
5. 可基于业务系统构建适配大模型运行的场景化数据集,设计业务对话中的边界案例;
6. 掌握Dify、Coze等工作流编排工具,具备Agent类项目的测试实践经验者优先;
7. 拥有多模态测试经验,能够对多模态场景下的边界情况、内容理解与泛化能力进行评估者更佳;
8. 熟练使用至少一种开发语言如Python或Java,熟悉Jmeter、Locust等常用性能测试工具;
9. 学习能力强,具备自我驱动力,沟通顺畅,思维敏捷,抗压性强,积极乐观,富有团队协作精神。
2026-06-26 14:13
IP属地:浙江杭州
职位福利
本科3-5年

杭州璞睿生命科技有限公司
A轮 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
中级测试工程师
9000-15000元/月
测试工程师5-10年本科软件测试自动化测试功能测试JavaC++Python黑盒灰盒测试JENKINS、GITSeleniumAPPIUM、JMETER入式硬件接口测试
杭州 临平区
测试工程师
1.1-1.6万元/月
测试工程师5-10年本科硬件测试仪器测试功能测试JavaPythonC++JmeterPostmanSeleniumUART、SPI、I2C、CAN
杭州 临平区






