职位详情
职位概述
我们正在寻找一名 DevOps 工程师,负责构建和维护支撑 AI 平台的云基础设施。
该岗位需保障 Web 应用与 AI 任务实现高效、安全且具备弹性的部署能力。
主要职责
• 搭建并运维 AWS/GCP/Azure 云环境(倾向使用 AWS)。
• 使用 Docker 与 Kubernetes 实现工作负载的容器化及集群调度。
• 搭建自动化 CI/CD 流水线(支持 GitHub Actions、GitLab CI、Jenkins)。
• 部署可观测性体系,涵盖监控、日志与告警系统(如 Prometheus、Grafana、ELK、Datadog)。
• 配置面向 Web 服务与 GPU 推理任务的动态扩缩容机制。
• 落实安全规范(包括 IAM 权限控制、VPC 网络隔离、密钥管理、防火墙策略)。
• 持续优化计算资源、存储方案及推理环节的云支出。
• 协同研发团队改进构建流程与发布效率。
岗位要求
• 具备 3 年以上 DevOps 或 SRE 相关实战经验。
• 熟练掌握 Kubernetes、Docker、Terraform/Helm 等核心工具链。
• 对云原生技术架构有深入理解。
• 有在公有云中运行和管理 GPU 类任务的实际经历。
• 熟悉主流日志采集与监控平台的技术原理与应用方式。
• 具备安全机制落地经验(如 TLS 加密配置、密钥轮替、入侵防御措施)。
优先条件
• 有 MLOps 实践或机器学习推理性能调优背景者优先。
• 具备 AI 任务在云端降本增效与弹性伸缩的实际项目经验。
• 了解跨区域高可用系统的设计与实施方法。
我们正在寻找一名 DevOps 工程师,负责构建和维护支撑 AI 平台的云基础设施。
该岗位需保障 Web 应用与 AI 任务实现高效、安全且具备弹性的部署能力。
主要职责
• 搭建并运维 AWS/GCP/Azure 云环境(倾向使用 AWS)。
• 使用 Docker 与 Kubernetes 实现工作负载的容器化及集群调度。
• 搭建自动化 CI/CD 流水线(支持 GitHub Actions、GitLab CI、Jenkins)。
• 部署可观测性体系,涵盖监控、日志与告警系统(如 Prometheus、Grafana、ELK、Datadog)。
• 配置面向 Web 服务与 GPU 推理任务的动态扩缩容机制。
• 落实安全规范(包括 IAM 权限控制、VPC 网络隔离、密钥管理、防火墙策略)。
• 持续优化计算资源、存储方案及推理环节的云支出。
• 协同研发团队改进构建流程与发布效率。
岗位要求
• 具备 3 年以上 DevOps 或 SRE 相关实战经验。
• 熟练掌握 Kubernetes、Docker、Terraform/Helm 等核心工具链。
• 对云原生技术架构有深入理解。
• 有在公有云中运行和管理 GPU 类任务的实际经历。
• 熟悉主流日志采集与监控平台的技术原理与应用方式。
• 具备安全机制落地经验(如 TLS 加密配置、密钥轮替、入侵防御措施)。
优先条件
• 有 MLOps 实践或机器学习推理性能调优背景者优先。
• 具备 AI 任务在云端降本增效与弹性伸缩的实际项目经验。
• 了解跨区域高可用系统的设计与实施方法。
2026-05-18 13:57
IP属地:广东深圳
职位福利
本科3-5年

深圳品阔信息技术有限公司
未融资 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
DevOps工程师
1.5-3万元/月
运维开发工程师5-10年本科CCNA/CCNPJava运维开发经验HCNA/HCNPPython/Shell计算机相关专业ITIL英语Kubernetes
深圳 南山区

杨先生 · 中电金信5日内活跃
容器SRE平台技术专家
3-6万元/月
运维开发工程师5-10年本科GolangCCNA/CCNPCCIEDockerHCIE运维开发经验HCNA/HCNP计算机相关专业ITILKubernetes
深圳 南山区

张先生 · 阿里云5日内活跃
区块链运维开发工程师
2-3万元/月
运维开发工程师5-10年大专Golang大数据运维经验AWS/K8S运维开发经验CI/CDPython/Shell计算机相关专业WAF
深圳 南山区

胡女士 · 星创智己5日内活跃




