职位详情
岗位职责:
1、系统稳定性保障
负责公司核心业务系统的7x24高可用架构设计、部署及稳定性优化,制定并实施容灾、容错机制。
主导生产环境故障的快速响应、根因定位及长效改进方案落地,持续提升SLA/SLO指标水平。
2、持续交付与自动化
设计并优化CI/CD流水线,推进自动化发布、灰度上线、蓝绿部署等实践,提高交付效率与质量。
开发运维工具链(如监控告警、日志分析、资源调度等),实现运维流程的自动化与智能化管理。
3、监控与可观测性体系
搭建多维度监控体系(Metrics/Logs/Tracing),基于Prometheus、ELK、Grafana等工具实现全链路业务可观测性。
通过数据分析驱动性能优化,提前发现潜在隐患并推动预防性治理措施执行。
4、成本与资源管理
负责云资源(AWS/Aliyun等)或物理服务器的规划、成本控制及利用率提升,制定容量管理策略。
推进FinOps理念落地,兼顾系统性能与资源成本,实现精细化运营目标。
5、运维规范与协作
建立标准化运维流程(变更管理、应急预案、安全合规等),推动DevOps文化深入实施。
协同开发、测试、安全团队,优化跨职能协作机制,提升整体研发运作效率。
任职资格:
1、学历与经验:
本科及以上学历,计算机、通信等相关专业,具备3年以上运维开发或业务运维工作经验,有复杂系统运维背景者优先。
熟悉互联网高并发场景与分布式系统架构,掌握微服务、容器化及云原生技术原理与应用。
2、技术能力:
精通Linux系统、网络协议及性能调优方法,熟练使用Shell/Python/Go至少一种语言开发运维脚本。
熟悉Ansible/Terraform等自动化工具,具有Kubernetes在生产环境中的实际运维经验。
深入理解至少一种主流公有云核心服务及其运维实践者优先考虑。
熟悉监控告警体系建设(如Zabbix/Prometheus+Alertmanager),具备端到端故障排查能力。
3、软性要求:
具备良好的业务理解力,能准确识别需求并转化为可行的技术解决方案。
抗压能力强,擅长应对突发故障,具备系统化问题分析与解决能力。
拥有出色的沟通协调能力与团队合作意识,能够有效推进跨部门项目执行。
加分项:
1、具备存储系统或接入层服务类运维实践经验者优先。
2、了解AIOps、混沌工程(ChaosEngineering)等先进运维技术实践。
3、持有云平台(腾讯云/AWS/Aliyun认证)或PMP等相关专业认证者优先。
1、系统稳定性保障
负责公司核心业务系统的7x24高可用架构设计、部署及稳定性优化,制定并实施容灾、容错机制。
主导生产环境故障的快速响应、根因定位及长效改进方案落地,持续提升SLA/SLO指标水平。
2、持续交付与自动化
设计并优化CI/CD流水线,推进自动化发布、灰度上线、蓝绿部署等实践,提高交付效率与质量。
开发运维工具链(如监控告警、日志分析、资源调度等),实现运维流程的自动化与智能化管理。
3、监控与可观测性体系
搭建多维度监控体系(Metrics/Logs/Tracing),基于Prometheus、ELK、Grafana等工具实现全链路业务可观测性。
通过数据分析驱动性能优化,提前发现潜在隐患并推动预防性治理措施执行。
4、成本与资源管理
负责云资源(AWS/Aliyun等)或物理服务器的规划、成本控制及利用率提升,制定容量管理策略。
推进FinOps理念落地,兼顾系统性能与资源成本,实现精细化运营目标。
5、运维规范与协作
建立标准化运维流程(变更管理、应急预案、安全合规等),推动DevOps文化深入实施。
协同开发、测试、安全团队,优化跨职能协作机制,提升整体研发运作效率。
任职资格:
1、学历与经验:
本科及以上学历,计算机、通信等相关专业,具备3年以上运维开发或业务运维工作经验,有复杂系统运维背景者优先。
熟悉互联网高并发场景与分布式系统架构,掌握微服务、容器化及云原生技术原理与应用。
2、技术能力:
精通Linux系统、网络协议及性能调优方法,熟练使用Shell/Python/Go至少一种语言开发运维脚本。
熟悉Ansible/Terraform等自动化工具,具有Kubernetes在生产环境中的实际运维经验。
深入理解至少一种主流公有云核心服务及其运维实践者优先考虑。
熟悉监控告警体系建设(如Zabbix/Prometheus+Alertmanager),具备端到端故障排查能力。
3、软性要求:
具备良好的业务理解力,能准确识别需求并转化为可行的技术解决方案。
抗压能力强,擅长应对突发故障,具备系统化问题分析与解决能力。
拥有出色的沟通协调能力与团队合作意识,能够有效推进跨部门项目执行。
加分项:
1、具备存储系统或接入层服务类运维实践经验者优先。
2、了解AIOps、混沌工程(ChaosEngineering)等先进运维技术实践。
3、持有云平台(腾讯云/AWS/Aliyun认证)或PMP等相关专业认证者优先。
2026-06-21 14:25
IP属地:陕西西安
职位福利
本科3-5年GolangSRE运维开发/DevOps自动化运维Python/Shell计算机相关专业存储运维ShellLinux系统运维运维开发经验应用运维Python

腾讯科技(深圳)有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











