职位详情
【AI运维工程师】
岗位职责:
1.负责公司内部研发平台建设,设计并构建安全、稳定的沙箱执行环境,保障业务隔离与安全运行。
2.负责 Docker 容器化与隔离方案落地,优化容器编排、资源调度与镜像管理体系。
3.负责 CI/CD 流水线搭建与维护,实现代码提交、自动构建、自动化测试、部署发布全流程自动化。
4.负责日志采集、存储、检索与监控体系建设,提升问题排查与系统可观测性。
5.负责研发平台权限控制体系设计与实现,保障多角色、多环境下的权限安全与最小化原则。
6.支持大模型及 AI 应用的工程化部署,设计高可用、可扩展的模型服务架构(如推理 API、批处理任务、GPU 资源调度等)。
7.持续优化研发效能,推动基础设施标准化、自动化、平台化,赋能算法团队高效完成模型训练、验证与上线。
任职要求:
1.统招本科及以上学历,计算机相关专业,3年及以上 DevOps / 平台工程 / SRE 相关工作经验。
2.熟练掌握 Docker 容器技术,理解容器隔离原理、镜像优化、多环境隔离实践;熟悉 GPU 容器化(如 NVIDIA Container Toolkit)者优先。
3.熟悉主流 CI/CD 工具链(如 Jenkins、GitLab CI、Argo CD),能够独立设计、搭建、维护自动化构建与发布流程。
4.熟悉日志采集、监控链路方案,有 ELK、Loki、Prometheus、Grafana 等相关实践经验优先。
5.具备权限系统设计经验,理解 RBAC 等权限模型,有平台权限落地经验优先。
6.熟悉 Linux 操作系统、Shell/Python/Go 至少一种脚本或开发语言;有模型服务框架(如 Triton Inference Server、TorchServe、vLLM、FastAPI 封装模型)使用或集成经验者优先。
7.了解大模型部署基本流程,包括模型格式转换(ONNX 等)、量化、推理优化、服务暴露、弹性扩缩容等 MLOps 关键环节。
8.具备良好的问题排查能力、系统思维和团队协作意识,能独立承担模块建设,对 AI 基础设施方向有浓厚兴趣者优先。
岗位职责:
1.负责公司内部研发平台建设,设计并构建安全、稳定的沙箱执行环境,保障业务隔离与安全运行。
2.负责 Docker 容器化与隔离方案落地,优化容器编排、资源调度与镜像管理体系。
3.负责 CI/CD 流水线搭建与维护,实现代码提交、自动构建、自动化测试、部署发布全流程自动化。
4.负责日志采集、存储、检索与监控体系建设,提升问题排查与系统可观测性。
5.负责研发平台权限控制体系设计与实现,保障多角色、多环境下的权限安全与最小化原则。
6.支持大模型及 AI 应用的工程化部署,设计高可用、可扩展的模型服务架构(如推理 API、批处理任务、GPU 资源调度等)。
7.持续优化研发效能,推动基础设施标准化、自动化、平台化,赋能算法团队高效完成模型训练、验证与上线。
任职要求:
1.统招本科及以上学历,计算机相关专业,3年及以上 DevOps / 平台工程 / SRE 相关工作经验。
2.熟练掌握 Docker 容器技术,理解容器隔离原理、镜像优化、多环境隔离实践;熟悉 GPU 容器化(如 NVIDIA Container Toolkit)者优先。
3.熟悉主流 CI/CD 工具链(如 Jenkins、GitLab CI、Argo CD),能够独立设计、搭建、维护自动化构建与发布流程。
4.熟悉日志采集、监控链路方案,有 ELK、Loki、Prometheus、Grafana 等相关实践经验优先。
5.具备权限系统设计经验,理解 RBAC 等权限模型,有平台权限落地经验优先。
6.熟悉 Linux 操作系统、Shell/Python/Go 至少一种脚本或开发语言;有模型服务框架(如 Triton Inference Server、TorchServe、vLLM、FastAPI 封装模型)使用或集成经验者优先。
7.了解大模型部署基本流程,包括模型格式转换(ONNX 等)、量化、推理优化、服务暴露、弹性扩缩容等 MLOps 关键环节。
8.具备良好的问题排查能力、系统思维和团队协作意识,能独立承担模块建设,对 AI 基础设施方向有浓厚兴趣者优先。
2026-06-02 14:50
IP属地:广东
职位福利
本科3-5年

上和国瑞(广州)互联科技有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









