职位详情
工作职责:
1. 负责公司业务系统的架构规划、容量管理、日常维护及故障响应,持续优化系统资源使用效率与运行稳定性。
2. 参与产品服务的技术架构分析与风险识别,推进系统在可靠性、性能表现和运维便捷性方面的持续改进。
3. 设计并开发自动化运维平台及相关工具,提升发布效率与运维标准化水平,深入探索并引入先进的运维方法与技术实践。
4. 主导统一监控体系的建设、运营与功能拓展,保障系统状态可实时观测、问题可快速定位、异常可及时告警。
5. 牵头重大系统变更上线、应急预案制定、应急处置和故障模拟演练,推动稳定性体系建设及SLO/SLA的实施落地。
任职要求:
1. 统招本科及以上学历,计算机或相关专业背景,具有5年以上运维领域实际工作经验。
2. 精通Shell脚本编写,掌握至少一门高级编程语言,如Python/Go,具备较强的自动化工具研发能力。
3. 理解Kubernetes集群架构与网络机制,熟练运用Helm、Kustomize等编排工具,有容器平台运维实战经历。
4. 熟练应用Prometheus、Grafana、Alertmanager等开源监控组件,具备监控系统搭建与定制化开发能力。
5. 掌握CI/CD流程实现机制,熟悉GitLab CI、Jenkins、Harbor、Maven等主流DevOps工具链的使用与集成。
6. 了解微服务架构原理,熟悉服务治理、服务注册与发现等关键技术,有分布式系统运维经验者优先考虑。
7. 具备良好的沟通协作能力与团队意识,责任心强,具备主动推动问题解决和持续优化的能力。
加分项:
1. 具备SRE、DevOps、平台工程或云原生架构相关项目经验者优先;
2. 有高可用架构设计、容量规划、系统性能调优等实际落地经验者优先;
3. 熟悉Service Mesh(如Istio)、日志系统(如Loki/ELK)、混沌工程或容灾演练工具者优先;
4. 持有CNCF、CKA、CKAD、AWS/Azure/GCP等相关认证者优先。
1. 负责公司业务系统的架构规划、容量管理、日常维护及故障响应,持续优化系统资源使用效率与运行稳定性。
2. 参与产品服务的技术架构分析与风险识别,推进系统在可靠性、性能表现和运维便捷性方面的持续改进。
3. 设计并开发自动化运维平台及相关工具,提升发布效率与运维标准化水平,深入探索并引入先进的运维方法与技术实践。
4. 主导统一监控体系的建设、运营与功能拓展,保障系统状态可实时观测、问题可快速定位、异常可及时告警。
5. 牵头重大系统变更上线、应急预案制定、应急处置和故障模拟演练,推动稳定性体系建设及SLO/SLA的实施落地。
任职要求:
1. 统招本科及以上学历,计算机或相关专业背景,具有5年以上运维领域实际工作经验。
2. 精通Shell脚本编写,掌握至少一门高级编程语言,如Python/Go,具备较强的自动化工具研发能力。
3. 理解Kubernetes集群架构与网络机制,熟练运用Helm、Kustomize等编排工具,有容器平台运维实战经历。
4. 熟练应用Prometheus、Grafana、Alertmanager等开源监控组件,具备监控系统搭建与定制化开发能力。
5. 掌握CI/CD流程实现机制,熟悉GitLab CI、Jenkins、Harbor、Maven等主流DevOps工具链的使用与集成。
6. 了解微服务架构原理,熟悉服务治理、服务注册与发现等关键技术,有分布式系统运维经验者优先考虑。
7. 具备良好的沟通协作能力与团队意识,责任心强,具备主动推动问题解决和持续优化的能力。
加分项:
1. 具备SRE、DevOps、平台工程或云原生架构相关项目经验者优先;
2. 有高可用架构设计、容量规划、系统性能调优等实际落地经验者优先;
3. 熟悉Service Mesh(如Istio)、日志系统(如Loki/ELK)、混沌工程或容灾演练工具者优先;
4. 持有CNCF、CKA、CKAD、AWS/Azure/GCP等相关认证者优先。
2026-05-11 12:54
IP属地:北京
职位福利
本科5-10年运维开发/DevOpsPrometheus计算机相关专业运维经验Kubernetes

中电信人工智能科技(北京)有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










