搜索
登录注册

职位详情

职位描述
1. 深入理解主流AI芯片与服务器架构,分析硬件加速特性及内部拓扑结构,输出可落地的硬件优化实践方案与调优指导,充分释放硬件性能潜力。
2. 基于主流LLM推理框架(如sglang/vLLM)以及大模型结构和计算特征,通过软硬件协同设计与技术突破(涵盖硬件算子优化、显存管理、并行策略等),完成新服务器平台端到端性能评估与深度优化。
3. 提供面向具体应用场景的定制化优化能力,精准识别大模型在多样化业务场景中的性能瓶颈,快速制定并实施满足实际需求的性能提升方案。
4. 熟练运用系统级调优与Profiling工具(如nsys/ncu系列、Perf、火焰图等),开展系统性能剖析与瓶颈定位,并结合硬件特性实现软件层面的适配与优化。
5. 把握大模型技术发展脉络,结合硬件Profling与Trace数据,为下一代AI基础设施的服务器架构设计与研发提供有力的数据支撑与量化分析依据。

职位要求
1. 具备扎实的工程开发基础,熟练掌握C++和Python编程语言,拥有Cuda/Cutlass/Trition相关开发经验,具备高性能推理代码编写与优化实战经历。
2. 熟悉主流AI加速芯片(如NVIDIA、AMD、寒武纪/DCU等)的体系结构、指令集与计算特点,具有在异构计算环境下进行开发与性能调优的实际经验。
3. 掌握sglang/vLLM/Pytorch等主流LLM推理框架,具备二次开发或深度优化能力(包括KV Cache优化、编译优化、Speculative推理、量化、DeepEP等技术)。
4. 了解服务器硬件架构(CPU、内存、网络、存储等)及多异构芯片互联拓扑,具备系统级性能分析与瓶颈诊断能力,能根据硬件特性开展软件适配与优化工作。
5. 具备良好的沟通协作与项目管理能力,能够与跨专业背景团队高效协同,合理组织资源、推进计划,保障项目按时高质量交付。

如下经验优先:
1. 性能调优经验:具备sglang/vLLM在新硬件平台上的适配与优化经验,有针对Qwen /DeepSeek模型进行性能优化者优先。
2. 算子优化经验:面向大模型场景,具备cutlass、Trition算子优化经验,熟悉投机采样、TP/EP并行优化者优先。
2026-05-20 13:30
IP属地:浙江杭州

职位福利

本科3-5年cudaC++Python
企业发布信息图
阿里云计算有限公司
不需要融资 · 10000人以上
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

高级网络安全研发/专家(Linux-C)
3-5.5万元/月
C/C++3-5年硕士CDPDKLinux开发/部署经验安全网关网关
杭州 西湖区
分布式大数据开发工程师
3.5-6.5万元/月
C/C++3-5年硕士GolangC++C
杭州 西湖区
网络系统软件技术专家-杭州
2-4万元/月
C/C++5-10年本科GolangBarefootC++CLinux开发/部署经验BroadcomPython
杭州 西湖区
阿里云-块存储-技术专家/高级技术专家
4-7万元/月
C/C++5-10年硕士C++分布式经验架构设计经验存储Linux开发/部署经验云计算
杭州 西湖区
c++高级开发工程师
3.5-4.5万元/月
C/C++3-5年硕士编译器开发经验C++C分布式经验数据库开发经验分布式计算存储引擎STL大数据
杭州 西湖区
阿里云智能-云网络软硬协同研发专家-杭
5-6.5万元/月
C/C++5-10年本科C++CMySQL云网络 dpdk openflowLinux开发/部署经验Python
杭州 西湖区
研发专家-云内可观测平台-杭州/北京
2-4万元/月
C/C++5-10年本科GolangC++ClickHouseELKPrometheusOpenTelemetryPython
杭州 西湖区
阿里云智能-云网络虚拟化系统研发专家-杭
3-3.5万元/月
C/C++5-10年硕士C分布式经验架构设计经验Linux开发/部署经验NFV
杭州 西湖区
AI搜索引擎技术专家-搜索算法方向
4-6.5万元/月
C/C++5-10年本科
杭州 西湖区
虚拟化研发技术专家/虚拟化运维开发工程师
2.5-5万元/月
C/C++5-10年本科C++CBoostLinux开发/部署经验
杭州 西湖区