职位详情
职位描述
1. 深入掌握主流AI芯片架构,分析硬件系统设计,输出软硬件协同优化方案及性能调优实践指导;
2. 理解AI、大数据与HPC类应用在异构计算环境下的技术挑战,结合AI加速器特性,构建高性能异构计算解决方案;
3. 专注异构资源的实时性能监控与分析,主导系统层面性能评估与业务瓶颈识别,提升异构集群的高可用性;
4. 推进异构计算基础平台向serverless架构演进,支撑云原生异构计算体系的技术迭代;
5. 把握人工智能与深度学习应用场景的发展方向,参与未来机器学习算力产品的架构规划与设计。
职位要求
1. 具备良好的编程能力,熟练掌握C/C++/Go/Rust等语言,具备规范化的软件工程实践经验;
2. 精通Linux操作系统,有大型生产级系统软件开发与运维背景;
3. 掌握异构计算编程模型,熟悉主流AI加速芯片(如NVIDIA, AMD等)的体系结构与计算原理;
4. 熟练使用异构硬件性能调优工具及Profiling手段,如nsys/ncu等系列工具;
5. 熟悉docker/containerd等容器运行时机制,了解kubernetes架构设计与编程模式;
6. 能够阅读英文技术资料,计算机相关专业毕业,具备3年以上云计算或AI基础设施研发经历。
优先考虑:
1. 具备GPU驱动开发经验者优先;
2. 有大规模GPU集群资源管理经验者优先,具备Kubernetes二次开发能力者优先;
3. 具备大规模GPU集群监控、在线性能剖析及稳定性建设经验者优先;
4. 熟悉docker/pouch/containerd源码者优先;了解OCI规范,具备OCI Hook开发经验者优先。
1. 深入掌握主流AI芯片架构,分析硬件系统设计,输出软硬件协同优化方案及性能调优实践指导;
2. 理解AI、大数据与HPC类应用在异构计算环境下的技术挑战,结合AI加速器特性,构建高性能异构计算解决方案;
3. 专注异构资源的实时性能监控与分析,主导系统层面性能评估与业务瓶颈识别,提升异构集群的高可用性;
4. 推进异构计算基础平台向serverless架构演进,支撑云原生异构计算体系的技术迭代;
5. 把握人工智能与深度学习应用场景的发展方向,参与未来机器学习算力产品的架构规划与设计。
职位要求
1. 具备良好的编程能力,熟练掌握C/C++/Go/Rust等语言,具备规范化的软件工程实践经验;
2. 精通Linux操作系统,有大型生产级系统软件开发与运维背景;
3. 掌握异构计算编程模型,熟悉主流AI加速芯片(如NVIDIA, AMD等)的体系结构与计算原理;
4. 熟练使用异构硬件性能调优工具及Profiling手段,如nsys/ncu等系列工具;
5. 熟悉docker/containerd等容器运行时机制,了解kubernetes架构设计与编程模式;
6. 能够阅读英文技术资料,计算机相关专业毕业,具备3年以上云计算或AI基础设施研发经历。
优先考虑:
1. 具备GPU驱动开发经验者优先;
2. 有大规模GPU集群资源管理经验者优先,具备Kubernetes二次开发能力者优先;
3. 具备大规模GPU集群监控、在线性能剖析及稳定性建设经验者优先;
4. 熟悉docker/pouch/containerd源码者优先;了解OCI规范,具备OCI Hook开发经验者优先。
2026-05-20 12:34
IP属地:浙江杭州
职位福利
本科3-5年C++GPU驱动CK8S异构计算

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >





