职位详情
【团队介绍】
阿里巴巴-阿里云智能-弹性计算 是阿里云飞天平台(阿里云自研云计算操作系统)的核心,在全球有数百个数据中心,为全球用户提供着可靠的计算服务。
欢迎加入弹性计算团队,来和我们一起共同管理海量物理机和虚拟机,提供超大规模服务编排能力。
【职位描述】
作为弹性计算平台核心研发工程师,您将参与或主导大规模IaaS资源全生命周期管理系统的架构设计与研发工作,负责构建支撑百万级服务器资源调度能力的智能管理平台。该职位将直面云计算基础设施领域最核心的资源管理挑战,涉及资源一致性保障、超大规模容量调度、服务质量SLA保障等关键技术方向。
主要职责包括:
1. 技术架构规划与方案设计
● 基于需求分析开展技术可行性评估与方案评审,结合现有技术架构完成技术选型及研发规划, 明确技术目标、范围及交付成果;
● 基于技术方案拆解任务目标,完成子任务的设计、编码开发及系统功能实现,确保产出符合规范;
● 主导资源管理平台技术演进路线规划,制定涵盖资源建模、智能编排调度、容量管理等核心模块的技术解决方案;
● 设计高可用分布式系统架构,构建支持百亿级资源元数据管理、分钟级全局资源视图同步、秒级资源事件溯源的核心引擎;
● 推进云原生技术栈深度应用,主导 ServiceMesh、Serverless 架构在资源调度系统的落地实践。
2. 核心系统研发与工程实现
● 开发智能资源编排调度引擎,实现基础设施全生命周期的资源调度与编排功能;
● 构建资源基线及画像系统,基于最优化算法平衡资源转化效率与组件服务质量管理;
● 主导关键模块的代码评审与技术方案论证,编写技术文档(操作手册、故障排除指南、API 文档等),支撑日常运维与问题答疑;
● 负责核心功能架构与代码模板编写,并通过阶段性 CodeReview、调试优化及部署协作,推动代码高质量交付;
● 负责开发及部署后系统的维护迭代,包括值班 oncall、Bug 排查、问题诊断、产品体验优化、性能及成本调优。
3. 安全、稳定与性能优化
● 运用产品优化技术提升系统安全性与性能,增强平台稳定性与用户体验。
4. 技术预研与趋势洞察
● 跟踪国内外资源管理平台技术发展动态,结合业务需求提供技术支持及架构建议。
5. 技术规划与业务协同
● 深度理解业务重点,基于需求设计高可用、高可靠、高扩展性的技术架构,并推动方案落地。
【我们期待您具备】
• 计算机基础扎实,具备Golang实际项目开发经验,熟练掌握Golang运行原理;
• 5年以上IT、互联网、云计算开发、运维相关工作经验;
• 熟悉Linux操作系统并具备常见问题诊断能力,了解内存管理、调度、文件系统、网络等相关机制;
• 对常用算法理解透彻,能够独立分析拆解业务问题转化为有效的工程方案;
• 具备良好的代码质量意识,熟悉单元测试和自动化接口测试;
• 对自己负责的研发模块具备快速上线、响应、应急处理能力;
• 能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作;
• 善于沟通,乐于总结分享,有良好的团队协作能力,对解决具有挑战性的问题充满激情。
加分项:
• 熟悉云计算业务,具备大型系统架构经验,有云资源管理平台开发经验和阿里云OpenAPI使用经验;
• 熟悉容器、K8s相关生态,具备大规模K8s生产集群管理实践经验;
• 熟悉 AI 大模型,善于使用 AI 工具,并在生产系统中有过实践经验;
• 在SIGCOMM、NSDI、OSDI等顶级会议上发表论文或具有专利成果者优先。
阿里巴巴-阿里云智能-弹性计算 是阿里云飞天平台(阿里云自研云计算操作系统)的核心,在全球有数百个数据中心,为全球用户提供着可靠的计算服务。
欢迎加入弹性计算团队,来和我们一起共同管理海量物理机和虚拟机,提供超大规模服务编排能力。
【职位描述】
作为弹性计算平台核心研发工程师,您将参与或主导大规模IaaS资源全生命周期管理系统的架构设计与研发工作,负责构建支撑百万级服务器资源调度能力的智能管理平台。该职位将直面云计算基础设施领域最核心的资源管理挑战,涉及资源一致性保障、超大规模容量调度、服务质量SLA保障等关键技术方向。
主要职责包括:
1. 技术架构规划与方案设计
● 基于需求分析开展技术可行性评估与方案评审,结合现有技术架构完成技术选型及研发规划, 明确技术目标、范围及交付成果;
● 基于技术方案拆解任务目标,完成子任务的设计、编码开发及系统功能实现,确保产出符合规范;
● 主导资源管理平台技术演进路线规划,制定涵盖资源建模、智能编排调度、容量管理等核心模块的技术解决方案;
● 设计高可用分布式系统架构,构建支持百亿级资源元数据管理、分钟级全局资源视图同步、秒级资源事件溯源的核心引擎;
● 推进云原生技术栈深度应用,主导 ServiceMesh、Serverless 架构在资源调度系统的落地实践。
2. 核心系统研发与工程实现
● 开发智能资源编排调度引擎,实现基础设施全生命周期的资源调度与编排功能;
● 构建资源基线及画像系统,基于最优化算法平衡资源转化效率与组件服务质量管理;
● 主导关键模块的代码评审与技术方案论证,编写技术文档(操作手册、故障排除指南、API 文档等),支撑日常运维与问题答疑;
● 负责核心功能架构与代码模板编写,并通过阶段性 CodeReview、调试优化及部署协作,推动代码高质量交付;
● 负责开发及部署后系统的维护迭代,包括值班 oncall、Bug 排查、问题诊断、产品体验优化、性能及成本调优。
3. 安全、稳定与性能优化
● 运用产品优化技术提升系统安全性与性能,增强平台稳定性与用户体验。
4. 技术预研与趋势洞察
● 跟踪国内外资源管理平台技术发展动态,结合业务需求提供技术支持及架构建议。
5. 技术规划与业务协同
● 深度理解业务重点,基于需求设计高可用、高可靠、高扩展性的技术架构,并推动方案落地。
【我们期待您具备】
• 计算机基础扎实,具备Golang实际项目开发经验,熟练掌握Golang运行原理;
• 5年以上IT、互联网、云计算开发、运维相关工作经验;
• 熟悉Linux操作系统并具备常见问题诊断能力,了解内存管理、调度、文件系统、网络等相关机制;
• 对常用算法理解透彻,能够独立分析拆解业务问题转化为有效的工程方案;
• 具备良好的代码质量意识,熟悉单元测试和自动化接口测试;
• 对自己负责的研发模块具备快速上线、响应、应急处理能力;
• 能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作;
• 善于沟通,乐于总结分享,有良好的团队协作能力,对解决具有挑战性的问题充满激情。
加分项:
• 熟悉云计算业务,具备大型系统架构经验,有云资源管理平台开发经验和阿里云OpenAPI使用经验;
• 熟悉容器、K8s相关生态,具备大规模K8s生产集群管理实践经验;
• 熟悉 AI 大模型,善于使用 AI 工具,并在生产系统中有过实践经验;
• 在SIGCOMM、NSDI、OSDI等顶级会议上发表论文或具有专利成果者优先。
2026-05-13 12:20
IP属地:上海
职位福利
硕士5-10年GolangGolang服务端开发经验计算机相关专业

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










