职位详情
阿里云智能-AI智算集群监管控及算力管理平台技术专家-杭州/北京
职位描述
1. 负责灵骏监管控系统核心能力的构建,持续提升客户在云环境使用灵骏智算集群产品的自动化与智能化水平。
2. 打造智算集群的库存管理、节点调度、性能分析、故障自动处理、租户运维等关键功能体系,不断增强灵骏智算集群的产品优势。
3. 构建系统高可用架构,涵盖管控组件故障自动识别、自愈机制、弹性容灾能力以及云原生技术的落地实施,确保线上服务稳定运行与业务连续性。
4. 推进异构算力的统一管控与资源调度体系建设,持续优化集群资源利用效率,降低整体计算开销。
5. 持续关注AI智算、云原生及智能运维领域的前沿技术,结合实际业务场景推动技术创新与应用落地。
6. 本岗位包含值班支持职责,需在服务级别协议(SLA)规定时限内完成客户问题响应,推进问题闭环,提升客户满意度。
职位要求
1. 具备5年以上大规模分布式系统的设计与开发经验,曾独立主导多模块业务子系统的建设,包括接口规范制定、架构设计及核心分布式技术方案的落地实施。
2. 编程基础扎实,掌握数据结构与算法,熟练使用Golang/Java/Python/C++中至少一门编程语言。
3. 系统工程能力突出,具备强烈的线上稳定性意识,对复杂系统有较强的技术洞察力和故障定位能力;有线上监控体系、变更流程设计与研发经验者优先考虑。
4. 业务理解能力强,具备优秀的抽象建模能力,逻辑清晰,善于思考,能独立开展问题分析与解决,有主导完整技术产品项目经历者优先。
5. 具备复杂项目管理经验,有担任项目负责人或研发团队对接人角色者优先。
6. 具备良好的团队协作能力,有实线或虚线带领团队完成技术任务的经验者优先。
7. 熟悉AI框架、云原生架构、微服务原理及设计模式者优先。
职位描述
1. 负责灵骏监管控系统核心能力的构建,持续提升客户在云环境使用灵骏智算集群产品的自动化与智能化水平。
2. 打造智算集群的库存管理、节点调度、性能分析、故障自动处理、租户运维等关键功能体系,不断增强灵骏智算集群的产品优势。
3. 构建系统高可用架构,涵盖管控组件故障自动识别、自愈机制、弹性容灾能力以及云原生技术的落地实施,确保线上服务稳定运行与业务连续性。
4. 推进异构算力的统一管控与资源调度体系建设,持续优化集群资源利用效率,降低整体计算开销。
5. 持续关注AI智算、云原生及智能运维领域的前沿技术,结合实际业务场景推动技术创新与应用落地。
6. 本岗位包含值班支持职责,需在服务级别协议(SLA)规定时限内完成客户问题响应,推进问题闭环,提升客户满意度。
职位要求
1. 具备5年以上大规模分布式系统的设计与开发经验,曾独立主导多模块业务子系统的建设,包括接口规范制定、架构设计及核心分布式技术方案的落地实施。
2. 编程基础扎实,掌握数据结构与算法,熟练使用Golang/Java/Python/C++中至少一门编程语言。
3. 系统工程能力突出,具备强烈的线上稳定性意识,对复杂系统有较强的技术洞察力和故障定位能力;有线上监控体系、变更流程设计与研发经验者优先考虑。
4. 业务理解能力强,具备优秀的抽象建模能力,逻辑清晰,善于思考,能独立开展问题分析与解决,有主导完整技术产品项目经历者优先。
5. 具备复杂项目管理经验,有担任项目负责人或研发团队对接人角色者优先。
6. 具备良好的团队协作能力,有实线或虚线带领团队完成技术任务的经验者优先。
7. 熟悉AI框架、云原生架构、微服务原理及设计模式者优先。
2026-05-17 15:07
IP属地:浙江杭州
职位福利
本科3-5年GolangJavaHibernate不接受居家办公C分布式经验SpringCloudHadoopRedisSpringDockerMySQLMyBatis云计算经验Ora

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
Java高级开发/技术骨干
2-3万元/月
Java3-5年本科不接受居家办公分布式经验SpringCloudRedisSpringHBase大数据经验Elasticsearch微服务经验MySQLMyBatis云计算经验Mong
杭州 西湖区

全女士 · 杭州零壹起舞网络技术5日内活跃








