职位详情
参与业务需求分析与系统架构评估,从质量保障和系统可观测性出发,提出可测试性设计优化建议;
主导智能运维及测试工具链的研发与持续迭代,涵盖自动化测试平台、故障注入框架、日志解析引擎等模块,有效提升研发与运维协同效率;
深入掌握AI与大模型相关业务场景中的质量挑战(如模型输出一致性、RAG结果准确率、Agent行为稳定性),通过代码抽象实现复杂校验逻辑的标准化与产品化封装;
搭建基于大语言模型的智能评估体系(LLM-as-a-Judge),构建自动化评测流水线,实现对生成式AI系统的量化质量追踪与监控;
输出高可靠的技术方案与接口规范,确保工具平台具备良好的可扩展性、稳定性和安全防护能力。
职位要求
扎实的工程实践能力:具备出色的系统架构设计与需求落地能力,能够独立完成清晰且可实施的技术方案与API接口定义;
熟练掌握Python语言:熟悉异步编程模型(asyncio)、高性能HTTP客户端(aiohttp、httpx)及数据处理库(pandas、numpy),具备规范的工程习惯(类型注解、单元测试、CI/CD集成);
了解AI与大模型基本原理及其应用场景:熟悉Prompt Engineering、RAG机制、Agent系统架构及LLM评估方法,有OpenAI、Claude、DeepSeek或开源模型(Llama/Qwen)实际开发经验者优先;
掌握核心后端技术体系:熟悉关系型数据库(MySQL/PostgreSQL)设计与Redis缓存应用,具备高并发环境下数据一致性的处理能力;
深入理解Linux系统底层机制(文件系统、进程调度、网络协议栈、IO模型),具备扎实的网络编程基础(TCP/HTTP/gRPC)及线上问题定位经验;
主导智能运维及测试工具链的研发与持续迭代,涵盖自动化测试平台、故障注入框架、日志解析引擎等模块,有效提升研发与运维协同效率;
深入掌握AI与大模型相关业务场景中的质量挑战(如模型输出一致性、RAG结果准确率、Agent行为稳定性),通过代码抽象实现复杂校验逻辑的标准化与产品化封装;
搭建基于大语言模型的智能评估体系(LLM-as-a-Judge),构建自动化评测流水线,实现对生成式AI系统的量化质量追踪与监控;
输出高可靠的技术方案与接口规范,确保工具平台具备良好的可扩展性、稳定性和安全防护能力。
职位要求
扎实的工程实践能力:具备出色的系统架构设计与需求落地能力,能够独立完成清晰且可实施的技术方案与API接口定义;
熟练掌握Python语言:熟悉异步编程模型(asyncio)、高性能HTTP客户端(aiohttp、httpx)及数据处理库(pandas、numpy),具备规范的工程习惯(类型注解、单元测试、CI/CD集成);
了解AI与大模型基本原理及其应用场景:熟悉Prompt Engineering、RAG机制、Agent系统架构及LLM评估方法,有OpenAI、Claude、DeepSeek或开源模型(Llama/Qwen)实际开发经验者优先;
掌握核心后端技术体系:熟悉关系型数据库(MySQL/PostgreSQL)设计与Redis缓存应用,具备高并发环境下数据一致性的处理能力;
深入理解Linux系统底层机制(文件系统、进程调度、网络协议栈、IO模型),具备扎实的网络编程基础(TCP/HTTP/gRPC)及线上问题定位经验;
2026-05-20 12:04
IP属地:陕西西安
职位福利
大专1-3年

武汉佰钧成技术有限责任公司
未融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
Python/JS/Java/go软件测试开发
1.3-2.6万元/月
Python经验不限本科留学生优先国内院校优先爬虫经验机器学习经验云计算经验GolangJavaPyTorchMySQLOracleSparkHive
西安 雁塔区

杨女士 · 外企德科5日内活跃








