职位详情
职位描述
1. 构建灵骏监管控系统的核心能力,持续提升客户在云环境使用灵骏智算集群产品的自动化与智能化水平。
2. 打造涵盖智算集群库存管理、节点调度、性能分析、故障自动处理及租户运维等功能的完整体系,不断增强灵骏智算集群产品的市场竞争力。
3. 完善系统的高可用架构,包括管控组件故障的自动识别与恢复、自适应容灾机制、云原生技术的应用与落地,确保业务连续性和线上系统的稳定运行。
4. 设计并实现异构算力的统一管控与资源调度平台,持续优化智算集群的资源利用效率,降低整体计算开销。
5. 持续关注AI智算、云原生及智能运维领域的前沿技术,结合实际业务场景推动技术创新与应用落地。
6. 该岗位需承担值班响应职责,在服务级别协议(SLA)规定时限内完成客户问题响应,推进问题闭环,提升客户满意度。
职位要求
1. 具备5年以上大规模分布式系统的设计与开发经验,曾独立主导包含多个模块的业务子系统建设,承担接口规范制定、架构设计及关键分布式技术方案的落地工作。
2. 编程基础扎实,熟练掌握数据结构与算法,精通Golang/Java/Python/C++中至少一门编程语言。
3. 具备出色的系统工程能力,重视线上稳定性,对复杂系统的运行状态有敏锐的技术洞察力,具备丰富的故障排查经验;有线上监控体系、变更流程或系统设计经验者优先。
4. 业务理解能力强,具备优秀的抽象建模能力,逻辑清晰,善于思考,能独立开展问题分析与解决,有主导并推动完整技术产品项目经历者优先。
5. 具备复杂项目的统筹管理能力,有担任项目负责人或研发团队对接人经验者优先。
6. 具备良好的团队协作意识,有实线或虚线带领团队完成技术项目的经验者优先。
7. 熟悉AI框架、云原生架构、微服务设计理念及常用设计模式者优先。
1. 构建灵骏监管控系统的核心能力,持续提升客户在云环境使用灵骏智算集群产品的自动化与智能化水平。
2. 打造涵盖智算集群库存管理、节点调度、性能分析、故障自动处理及租户运维等功能的完整体系,不断增强灵骏智算集群产品的市场竞争力。
3. 完善系统的高可用架构,包括管控组件故障的自动识别与恢复、自适应容灾机制、云原生技术的应用与落地,确保业务连续性和线上系统的稳定运行。
4. 设计并实现异构算力的统一管控与资源调度平台,持续优化智算集群的资源利用效率,降低整体计算开销。
5. 持续关注AI智算、云原生及智能运维领域的前沿技术,结合实际业务场景推动技术创新与应用落地。
6. 该岗位需承担值班响应职责,在服务级别协议(SLA)规定时限内完成客户问题响应,推进问题闭环,提升客户满意度。
职位要求
1. 具备5年以上大规模分布式系统的设计与开发经验,曾独立主导包含多个模块的业务子系统建设,承担接口规范制定、架构设计及关键分布式技术方案的落地工作。
2. 编程基础扎实,熟练掌握数据结构与算法,精通Golang/Java/Python/C++中至少一门编程语言。
3. 具备出色的系统工程能力,重视线上稳定性,对复杂系统的运行状态有敏锐的技术洞察力,具备丰富的故障排查经验;有线上监控体系、变更流程或系统设计经验者优先。
4. 业务理解能力强,具备优秀的抽象建模能力,逻辑清晰,善于思考,能独立开展问题分析与解决,有主导并推动完整技术产品项目经历者优先。
5. 具备复杂项目的统筹管理能力,有担任项目负责人或研发团队对接人经验者优先。
6. 具备良好的团队协作意识,有实线或虚线带领团队完成技术项目的经验者优先。
7. 熟悉AI框架、云原生架构、微服务设计理念及常用设计模式者优先。
2026-05-18 14:07
IP属地:北京
职位福利
本科5-10年GolangJava节点调度C++分布式经验SpringCloudMySQLSpring集群Python

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
高级后端开发工程师
1.6-2.6万元/月
Java5-10年本科分布式经验SpringCloudRedisSpringHiveElasticsearch微服务经验ZookeeperMySQLMyBatisMongoDB架构设计经验
北京 朝阳区

甘先生 · 爱连健康5日内活跃
阿里云金融行业应用上云交付专家
3-6万元/月
Java5-10年本科不接受居家办公Docker微服务经验SpringCloudMySQLKafkaMyBatisRedis云计算经验Dubbo
北京 朝阳区

张先生 · 阿里云5日内活跃








