职位详情
岗位职责:
1、深入了解客户业务场景与技术架构,协同客户侧的架构、开发及运维团队,全面分析其当前云环境下的应用架构与产品使用情况,聚焦稳定性、可观测性与成本效率,设计并推动实施高可用、高韧性、易维护的云上优化方案。涵盖方向包括:云原生监控体系搭建、风险主动识别机制、混沌工程与容灾演练、业务快速恢复与降级策略、微服务架构升级、FinOps成本管理以及高可用架构重构等。
2、联动阿里云内部的产品、研发、解决方案及技术支持团队,从客户架构视角出发,推进问题闭环处理、重大活动保障、风险治理与架构优化,沉淀可复用的方法论、实践案例与工具能力,主动洞察客户需求并提供高阶专项技术服务。
3、持续跟进客户关键稳定性议题,推动根因定位与长效治理机制落地,并将共性问题反馈至阿里云产品与服务体系,助力产品能力迭代与服务体验提升。
4、主导或深度参与客户云架构升级项目的落地执行,通过架构优化、资源治理与合理技术选型,持续提升系统性能、业务连续性与资源利用效率,达成“稳、快、省”的云上运营目标。
任职要求:
1、具备3年以上大型互联网或集团型企业级应用架构设计、系统稳定性保障、监控平台建设、DevOps/AIOps实践、高可用改造或运维体系构建经验,拥有端到端技术方案落地能力。
2、具备扎实编程基础,熟练掌握 Java/Python/Go 等主流语言,能高效实现业务逻辑与系统模块,具备算法设计与性能调优经验,可根据实际场景对核心算法或数据处理流程进行优化,提升系统吞吐量、响应速度与资源使用率。
3、具备大模型与AI类项目全流程实施、性能调优与高可用保障能力,熟悉AIOps在云原生环境中的应用实践,能够基于可观测性数据实现智能告警、根因定位与自动化恢复策略,增强AI系统在生产环境中的稳定性和运维效能。
4、在至少一个核心技术领域有深入积累,如数据库、网络、操作系统、Serverless、存储、音视频、大数据、人工智能或大模型等。
5、拥有3年以上大型项目上云或云上运维实战经历,具备优秀的跨团队协作能力、复杂项目推动力与强结果导向思维,同时具备良好的沟通协调能力、团队合作意识、持续学习动力与技术影响力。
6、高度认同“客户第一”理念,具备强烈的责任感与服务意识,致力于通过技术手段助力客户业务成功。
7、具备优秀的文档编写、技术宣讲与培训能力,能面向不同层级客户清晰传递技术价值与方案优势。
8、抗压能力强,执行力强,能接受阶段性出差安排。
加分项:
1、持有阿里云ACA/ACP/ACE认证者优先;
2、具备基于阿里云产品的大规模生产环境开发或运维经验;
3、有汽车行业运维背景,熟悉车联网、智能驾驶或智能座舱相关业务与技术架构者优先
1、深入了解客户业务场景与技术架构,协同客户侧的架构、开发及运维团队,全面分析其当前云环境下的应用架构与产品使用情况,聚焦稳定性、可观测性与成本效率,设计并推动实施高可用、高韧性、易维护的云上优化方案。涵盖方向包括:云原生监控体系搭建、风险主动识别机制、混沌工程与容灾演练、业务快速恢复与降级策略、微服务架构升级、FinOps成本管理以及高可用架构重构等。
2、联动阿里云内部的产品、研发、解决方案及技术支持团队,从客户架构视角出发,推进问题闭环处理、重大活动保障、风险治理与架构优化,沉淀可复用的方法论、实践案例与工具能力,主动洞察客户需求并提供高阶专项技术服务。
3、持续跟进客户关键稳定性议题,推动根因定位与长效治理机制落地,并将共性问题反馈至阿里云产品与服务体系,助力产品能力迭代与服务体验提升。
4、主导或深度参与客户云架构升级项目的落地执行,通过架构优化、资源治理与合理技术选型,持续提升系统性能、业务连续性与资源利用效率,达成“稳、快、省”的云上运营目标。
任职要求:
1、具备3年以上大型互联网或集团型企业级应用架构设计、系统稳定性保障、监控平台建设、DevOps/AIOps实践、高可用改造或运维体系构建经验,拥有端到端技术方案落地能力。
2、具备扎实编程基础,熟练掌握 Java/Python/Go 等主流语言,能高效实现业务逻辑与系统模块,具备算法设计与性能调优经验,可根据实际场景对核心算法或数据处理流程进行优化,提升系统吞吐量、响应速度与资源使用率。
3、具备大模型与AI类项目全流程实施、性能调优与高可用保障能力,熟悉AIOps在云原生环境中的应用实践,能够基于可观测性数据实现智能告警、根因定位与自动化恢复策略,增强AI系统在生产环境中的稳定性和运维效能。
4、在至少一个核心技术领域有深入积累,如数据库、网络、操作系统、Serverless、存储、音视频、大数据、人工智能或大模型等。
5、拥有3年以上大型项目上云或云上运维实战经历,具备优秀的跨团队协作能力、复杂项目推动力与强结果导向思维,同时具备良好的沟通协调能力、团队合作意识、持续学习动力与技术影响力。
6、高度认同“客户第一”理念,具备强烈的责任感与服务意识,致力于通过技术手段助力客户业务成功。
7、具备优秀的文档编写、技术宣讲与培训能力,能面向不同层级客户清晰传递技术价值与方案优势。
8、抗压能力强,执行力强,能接受阶段性出差安排。
加分项:
1、持有阿里云ACA/ACP/ACE认证者优先;
2、具备基于阿里云产品的大规模生产环境开发或运维经验;
3、有汽车行业运维背景,熟悉车联网、智能驾驶或智能座舱相关业务与技术架构者优先
2026-06-24 13:18
IP属地:广东广州
职位福利
本科5-10年

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
技术服务专家TAM-运维/系统可靠性方向
2.5-4.5万元/月
运维工程师3-5年本科MySQL/Oracle大数据运维经验运维开发/DevOps运维开发经验Python/Shell运维经验Kubernetes
广州 海珠区










