职位详情
岗位描述
1. 运维体系设计与持续优化:主导云平台运维组织架构、工具链及运营机制的设计与实施,保障云环境及其公共组件的高可用性与稳定性。
2. 统一化平台与工具集成:为解决因入口分散引发的资源管理难题,推进统一运维操作平台的应用,整合多类运维工具,提供标准化操作指引,提升管理效率与一致性。
3. 账号权限与资源配置管理:完善账号权限控制机制,实施精细化策略管理,强化资源使用水位监控与配额管理,确保访问隔离与资源高效利用。
4. 监控告警能力构建:针对现有监控覆盖不足问题,推动产品与资源的全维度监控体系建设,实现问题早发现、早预警,降低故障发生率及影响范围。
5. 标准化流程与知识沉淀:总结常见问题处理流程,建立标准化SOP和基础文档库,逐步形成结构化知识体系,提升团队协作与响应效率。
6. 稳定性技术改进项目推进:联合产研、SRE及业务团队,推动高可用架构与稳定性解决方案的落地实施,持续提供技术支持与优化建议。
任职要求
1、具备5年以上IT、互联网或云计算领域运维经验,持有阿里云ACP/ACE认证者优先,有海外工作背景者更佳。
2、能在多产品或中等复杂系统环境下严格执行研发安全规范与流程,确保系统具备容灾、可观测、可处置、可维护及快速恢复能力。
3、熟悉主流研发安全技术体系,并具备在团队中成功推行落地的经验,有效提升系统稳定性和安全水平者优先。
4、拥有跨产品线或中型复杂系统研发运维经验者优先,能应对复杂项目场景与突发状况,保障项目平稳交付。
5、面对部门级疑难问题,具备独立分析能力,能够提出创新性解决方案。
6、认同智能化与自动化运维理念,曾主导自动化运维平台建设,实现提效降本并增强系统稳定性。
7、通过数字化手段识别运营与人员管理中的潜在风险,构建完整的风险管理框架并推动执行落地。
1. 运维体系设计与持续优化:主导云平台运维组织架构、工具链及运营机制的设计与实施,保障云环境及其公共组件的高可用性与稳定性。
2. 统一化平台与工具集成:为解决因入口分散引发的资源管理难题,推进统一运维操作平台的应用,整合多类运维工具,提供标准化操作指引,提升管理效率与一致性。
3. 账号权限与资源配置管理:完善账号权限控制机制,实施精细化策略管理,强化资源使用水位监控与配额管理,确保访问隔离与资源高效利用。
4. 监控告警能力构建:针对现有监控覆盖不足问题,推动产品与资源的全维度监控体系建设,实现问题早发现、早预警,降低故障发生率及影响范围。
5. 标准化流程与知识沉淀:总结常见问题处理流程,建立标准化SOP和基础文档库,逐步形成结构化知识体系,提升团队协作与响应效率。
6. 稳定性技术改进项目推进:联合产研、SRE及业务团队,推动高可用架构与稳定性解决方案的落地实施,持续提供技术支持与优化建议。
任职要求
1、具备5年以上IT、互联网或云计算领域运维经验,持有阿里云ACP/ACE认证者优先,有海外工作背景者更佳。
2、能在多产品或中等复杂系统环境下严格执行研发安全规范与流程,确保系统具备容灾、可观测、可处置、可维护及快速恢复能力。
3、熟悉主流研发安全技术体系,并具备在团队中成功推行落地的经验,有效提升系统稳定性和安全水平者优先。
4、拥有跨产品线或中型复杂系统研发运维经验者优先,能应对复杂项目场景与突发状况,保障项目平稳交付。
5、面对部门级疑难问题,具备独立分析能力,能够提出创新性解决方案。
6、认同智能化与自动化运维理念,曾主导自动化运维平台建设,实现提效降本并增强系统稳定性。
7、通过数字化手段识别运营与人员管理中的潜在风险,构建完整的风险管理框架并推动执行落地。
2026-06-06 12:17
IP属地:浙江杭州
职位福利
本科5-10年

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
云计算实施工程师/专家
2.5-5万元/月
运维工程师5-10年硕士GolangDBA通信相关专业Ansible/Salt/Puppet系统运维运维开发经验运维开发/DevOps计算机相关专业Python/Shell电子/电气/自动化相关专业运维经
杭州 西湖区






