职位详情
岗位要求:
1、深刻理解客户业务场景与技术架构,协同客户侧的架构、开发及运维团队,全面评估其云上应用现状与产品使用情况,聚焦稳定性、可观测性与成本效能,设计并推进具备高可用、高韧性、高易用特性的云上架构优化方案。涉及方向包括但不限于:云原生监控体系搭建、风险主动识别机制、混沌工程与容灾演练实施、业务快速恢复与降级策略制定、微服务架构演进支持、FinOps成本管控以及高可用架构重构等。
2、联动阿里云内部产品、研发、解决方案及技术服务力量,从业务架构视角推动问题闭环管理、重大活动保障、风险治理与架构优化工作,沉淀可复制的方法论、最佳实践与工具能力,主动洞察客户需求并发起高阶技术服务项目。
3、持续跟进客户关键稳定性议题,推动根因定位与长效机制建设,并将典型场景反馈至阿里云产品与服务体系,助力产品能力迭代与服务升级。
4、主导或深度参与客户云环境下的架构升级项目落地,通过架构调优、资源治理与合理技术选型,持续提升系统性能、业务连续性与资源利用效率,达成“稳定、高效、节约”的云上运营目标。
职位描述:
1、具备3年以上在大型互联网或集团型企业中从事应用架构设计、系统稳定性保障、监控平台建设、DevOps/AIOps实践、高可用改造或运维体系构建的经验,拥有端到端解决方案成功落地的实际案例。
2、具备扎实的编程基础,熟练掌握 Java/Python/Go 等主流语言,能够高效完成业务逻辑与系统模块开发,具备算法设计与性能调优能力,可根据实际业务场景对核心算法或数据处理流程进行优化,提升系统吞吐量、响应速度与资源使用率。
3、具备大模型与AI类项目从实施到交付的全流程经验,熟悉AIOps在云原生环境中的应用实践,能够基于可观测性数据实现智能告警、根因分析与自动化恢复策略,增强AI系统在生产环境中的稳定性、可靠性与运维智能化水平。
4、在数据库、网络、操作系统、Serverless、存储、音视频、大数据、人工智能或大模型等至少一个核心技术领域有深入积累。
5、具有3年以上大规模系统上云或云上运维实战经历,具备优秀的跨团队协作能力、复杂项目推动力与强结果导向意识,善于沟通协调,具备良好的团队合作精神、持续学习动力与技术影响力。
6、具备优秀的文档编写、技术演讲与培训输出能力,能面向不同层级客户清晰传递技术方案价值。
7、抗压能力强,执行能力出色,能适应阶段性出差安排。
加分项:
1、持有阿里云ACA/ACP/ACE认证者优先;
2、有基于阿里云产品构建大规模生产系统的开发或运维经验者优先;
3、具备汽车行业相关运维背景,熟悉车联网、智能驾驶或智能座舱技术架构者优先
1、深刻理解客户业务场景与技术架构,协同客户侧的架构、开发及运维团队,全面评估其云上应用现状与产品使用情况,聚焦稳定性、可观测性与成本效能,设计并推进具备高可用、高韧性、高易用特性的云上架构优化方案。涉及方向包括但不限于:云原生监控体系搭建、风险主动识别机制、混沌工程与容灾演练实施、业务快速恢复与降级策略制定、微服务架构演进支持、FinOps成本管控以及高可用架构重构等。
2、联动阿里云内部产品、研发、解决方案及技术服务力量,从业务架构视角推动问题闭环管理、重大活动保障、风险治理与架构优化工作,沉淀可复制的方法论、最佳实践与工具能力,主动洞察客户需求并发起高阶技术服务项目。
3、持续跟进客户关键稳定性议题,推动根因定位与长效机制建设,并将典型场景反馈至阿里云产品与服务体系,助力产品能力迭代与服务升级。
4、主导或深度参与客户云环境下的架构升级项目落地,通过架构调优、资源治理与合理技术选型,持续提升系统性能、业务连续性与资源利用效率,达成“稳定、高效、节约”的云上运营目标。
职位描述:
1、具备3年以上在大型互联网或集团型企业中从事应用架构设计、系统稳定性保障、监控平台建设、DevOps/AIOps实践、高可用改造或运维体系构建的经验,拥有端到端解决方案成功落地的实际案例。
2、具备扎实的编程基础,熟练掌握 Java/Python/Go 等主流语言,能够高效完成业务逻辑与系统模块开发,具备算法设计与性能调优能力,可根据实际业务场景对核心算法或数据处理流程进行优化,提升系统吞吐量、响应速度与资源使用率。
3、具备大模型与AI类项目从实施到交付的全流程经验,熟悉AIOps在云原生环境中的应用实践,能够基于可观测性数据实现智能告警、根因分析与自动化恢复策略,增强AI系统在生产环境中的稳定性、可靠性与运维智能化水平。
4、在数据库、网络、操作系统、Serverless、存储、音视频、大数据、人工智能或大模型等至少一个核心技术领域有深入积累。
5、具有3年以上大规模系统上云或云上运维实战经历,具备优秀的跨团队协作能力、复杂项目推动力与强结果导向意识,善于沟通协调,具备良好的团队合作精神、持续学习动力与技术影响力。
6、具备优秀的文档编写、技术演讲与培训输出能力,能面向不同层级客户清晰传递技术方案价值。
7、抗压能力强,执行能力出色,能适应阶段性出差安排。
加分项:
1、持有阿里云ACA/ACP/ACE认证者优先;
2、有基于阿里云产品构建大规模生产系统的开发或运维经验者优先;
3、具备汽车行业相关运维背景,熟悉车联网、智能驾驶或智能座舱技术架构者优先
2026-05-15 12:43
IP属地:上海
职位福利
本科3-5年互联网/AI

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









