职位详情
职位描述
1. 基于公共云统一架构、OpenAPI规范、软件技术栈及交付运维体系,承担公共云异构计算产品的研发与交付工作。全面参与研发流程,保障产品在研发至运维全生命周期中的高效运作与持续优化。
2. 持续追踪异构计算领域的最新技术动态与发展趋向,深入研究先进GPU架构设计及相关技术,结合业务战略方向与核心需求,制定高可用、高可靠、高扩展性的技术架构方案,并推动其实际落地实施。
3. 与网络团队协同推进网络互联架构设计,面向分布式训练与推理应用场景,在软硬件协同及高性能网络领域探索性能提升路径,打造阿里云加速计算云服务器的关键技术优势。
4. 主导系统稳定性与安全性的研发与迭代,制定并执行稳定性保障策略,识别并消除系统潜在风险与性能瓶颈,覆盖线上复杂问题的定位与解决,持续提升平台运行的可靠性与服务品质。
职位要求
1. 具备计算机科学、电子工程、通信工程、电气工程等相关专业背景;熟练掌握Python、Shell、C/C++等编程语言,具备5年及以上相关领域工作经验。
2. 深刻理解GPU芯片与服务器整体架构,熟悉PCIe规范、Linux内核机制及KVM虚拟化技术,具备丰富的GPU驱动开发、系统性能分析与调优实践经验。
3. 掌握分布式并行计算原理与集合通信机制,具有GPU驱动开发(如OpenCL、CUDA、RoCM)、GPU编译器优化或AI场景下性能调优经验者优先。
4. 具备强烈的责任意识,能与上下游团队高效协作,快速响应并推动问题解决,落实有效技术方案;保持积极主动的学习习惯,对前沿技术充满探索热情。
1. 基于公共云统一架构、OpenAPI规范、软件技术栈及交付运维体系,承担公共云异构计算产品的研发与交付工作。全面参与研发流程,保障产品在研发至运维全生命周期中的高效运作与持续优化。
2. 持续追踪异构计算领域的最新技术动态与发展趋向,深入研究先进GPU架构设计及相关技术,结合业务战略方向与核心需求,制定高可用、高可靠、高扩展性的技术架构方案,并推动其实际落地实施。
3. 与网络团队协同推进网络互联架构设计,面向分布式训练与推理应用场景,在软硬件协同及高性能网络领域探索性能提升路径,打造阿里云加速计算云服务器的关键技术优势。
4. 主导系统稳定性与安全性的研发与迭代,制定并执行稳定性保障策略,识别并消除系统潜在风险与性能瓶颈,覆盖线上复杂问题的定位与解决,持续提升平台运行的可靠性与服务品质。
职位要求
1. 具备计算机科学、电子工程、通信工程、电气工程等相关专业背景;熟练掌握Python、Shell、C/C++等编程语言,具备5年及以上相关领域工作经验。
2. 深刻理解GPU芯片与服务器整体架构,熟悉PCIe规范、Linux内核机制及KVM虚拟化技术,具备丰富的GPU驱动开发、系统性能分析与调优实践经验。
3. 掌握分布式并行计算原理与集合通信机制,具有GPU驱动开发(如OpenCL、CUDA、RoCM)、GPU编译器优化或AI场景下性能调优经验者优先。
4. 具备强烈的责任意识,能与上下游团队高效协作,快速响应并推动问题解决,落实有效技术方案;保持积极主动的学习习惯,对前沿技术充满探索热情。
2026-05-20 15:03
IP属地:浙江杭州
职位福利
硕士3-5年CentOS/RedHat/UbuntuRDMA系统建设/运维经验Python/Shell计算机相关专业LLMGPU计算机/网络系统工程师通信/工程相关专业CUDALinux运维经

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
施工人员为主,会开车,有信息化设备施工安装经验,强弱电都涉及,最好有电工,登高证有项目管理经验的优先
7000-10000元/月
系统工程师5-10年大专电子/硬件系统工程师计算机相关专业通信/工程相关专业系统建设/运维经验Linux运维经验网络安全相关经验系统集成项目管理工程师
杭州 西湖区 古墩路

李女士 · 南桥7日内活跃







