职位详情
岗位职责:
1、深刻理解客户业务场景与技术体系,协同客户架构、开发及运维团队,全面分析其云上应用架构与产品使用情况,聚焦稳定性、可观测性与成本效能,设计并推进落地高可用、高韧性、高易用的云上优化方案。涵盖方向包括但不限于:云原生监控平台建设、风险主动识别机制、混沌工程与容灾演练实施、业务快速恢复与降级策略制定、微服务架构升级、FinOps成本管控以及高可用架构重塑等。
2、联动阿里云内部产品、研发、解决方案与技术支持团队,从客户架构视角推动问题闭环处理、重大活动保障、风险治理与架构优化,沉淀可复用的方法论、实践路径与工具能力,主动洞察客户需求并开展高阶技术服务专项。
3、持续跟进客户关键稳定性议题,推动根因定位与长效治理机制落地,并将反馈有效融入阿里云产品与服务体系,助力平台能力迭代与服务升级。
4、主导或深度参与客户云上架构演进项目的实施落地,通过架构优化、资源治理与技术选型,不断提升系统性能、业务连续性与资源利用效率,达成“稳、快、省”的云上运营目标。
任职要求:
1、3年以上大型互联网或集团型企业级应用架构设计、稳定性保障、监控体系搭建、DevOps/AIOps实践、高可用改造或运维体系建设经验,具备端到端解决方案落地能力。
2、具备扎实编程基础,熟练掌握 Java/Python/Go 等主流语言,能高效实现业务逻辑与系统模块,具备算法设计与性能调优能力,可根据实际场景对核心算法或数据处理流程进行优化,提升系统吞吐量、响应速度与资源效率。
3、具备大模型及AI类项目全流程实施、性能调优与高可用保障能力,熟悉AIOps在云原生环境中的落地应用,能够基于可观测性数据实现智能告警、根因定位与自愈机制,增强AI系统在生产环境中的稳定性和运维效能。
4、在至少一个核心技术领域有深入积累,如数据库、网络、操作系统、Serverless、存储、音视频、大数据、人工智能或大模型等。
5、拥有3年以上大型项目上云或云上运维实战经历,具备优秀的跨团队协作能力、复杂项目推动力与强结果导向思维,具有良好的沟通协调能力、团队合作意识、持续学习热情及技术影响力。
6、高度认同“客户第一”理念,具备强烈的责任感与服务意识,致力于通过技术手段助力客户业务成功。
7、具备优秀的文档编写、技术演讲与培训输出能力,能面向不同角色客户清晰传递技术价值与方案优势。
8、抗压能力强,执行能力突出,可接受阶段性出差安排。
加分项:
1、持有阿里云ACA/ACP/ACE认证者优先;
2、具备基于阿里云产品的大规模生产环境开发或运维经验;
3、有汽车行业运维背景,熟悉车联网、智能驾驶或智能座舱相关业务与技术架构者优先
1、深刻理解客户业务场景与技术体系,协同客户架构、开发及运维团队,全面分析其云上应用架构与产品使用情况,聚焦稳定性、可观测性与成本效能,设计并推进落地高可用、高韧性、高易用的云上优化方案。涵盖方向包括但不限于:云原生监控平台建设、风险主动识别机制、混沌工程与容灾演练实施、业务快速恢复与降级策略制定、微服务架构升级、FinOps成本管控以及高可用架构重塑等。
2、联动阿里云内部产品、研发、解决方案与技术支持团队,从客户架构视角推动问题闭环处理、重大活动保障、风险治理与架构优化,沉淀可复用的方法论、实践路径与工具能力,主动洞察客户需求并开展高阶技术服务专项。
3、持续跟进客户关键稳定性议题,推动根因定位与长效治理机制落地,并将反馈有效融入阿里云产品与服务体系,助力平台能力迭代与服务升级。
4、主导或深度参与客户云上架构演进项目的实施落地,通过架构优化、资源治理与技术选型,不断提升系统性能、业务连续性与资源利用效率,达成“稳、快、省”的云上运营目标。
任职要求:
1、3年以上大型互联网或集团型企业级应用架构设计、稳定性保障、监控体系搭建、DevOps/AIOps实践、高可用改造或运维体系建设经验,具备端到端解决方案落地能力。
2、具备扎实编程基础,熟练掌握 Java/Python/Go 等主流语言,能高效实现业务逻辑与系统模块,具备算法设计与性能调优能力,可根据实际场景对核心算法或数据处理流程进行优化,提升系统吞吐量、响应速度与资源效率。
3、具备大模型及AI类项目全流程实施、性能调优与高可用保障能力,熟悉AIOps在云原生环境中的落地应用,能够基于可观测性数据实现智能告警、根因定位与自愈机制,增强AI系统在生产环境中的稳定性和运维效能。
4、在至少一个核心技术领域有深入积累,如数据库、网络、操作系统、Serverless、存储、音视频、大数据、人工智能或大模型等。
5、拥有3年以上大型项目上云或云上运维实战经历,具备优秀的跨团队协作能力、复杂项目推动力与强结果导向思维,具有良好的沟通协调能力、团队合作意识、持续学习热情及技术影响力。
6、高度认同“客户第一”理念,具备强烈的责任感与服务意识,致力于通过技术手段助力客户业务成功。
7、具备优秀的文档编写、技术演讲与培训输出能力,能面向不同角色客户清晰传递技术价值与方案优势。
8、抗压能力强,执行能力突出,可接受阶段性出差安排。
加分项:
1、持有阿里云ACA/ACP/ACE认证者优先;
2、具备基于阿里云产品的大规模生产环境开发或运维经验;
3、有汽车行业运维背景,熟悉车联网、智能驾驶或智能座舱相关业务与技术架构者优先
2026-06-19 14:56
IP属地:广东广州
职位福利
本科5-10年GolangJava通信相关专业实施交付运维系统运维运维开发经验运维开发/DevOps计算机相关专业Python/Shell运维经验

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











