搜索
登录注册

职位详情

岗位GPU/CUDA加速开发工程师(高性能计算方向)
部门:研发中心
工作地点: 苏州
职位类型:全职/高级/专家级

岗位职责
1. GPU加速算法开发与优化
基于CUDA或OpenCL开发高性能GPU并行计算代码,重写并优化特定算子实现加速,优化深度学习、科学计算、图像处理等领域的核心算法。
针对PyTorch/TensorFlow等框架中的模型进行GPU算子定制化开发,提升训练/推理效率。
解决内存带宽、线程调度、核函数融合等GPU性能瓶颈问题。
解决数据切片处理的GPU加速问题。
2. 跨平台协助与部署
与算法工程师、软件工程师合作,将CPU算法迁移至GPU平台,实现10倍以上加速比。
支持多GPU及分布式集群环境下的代码部署与调优。
3. 工具链建设
开发自动化性能分析工具,构建GPU代码性能评估体系。
4. 行业落地
面向制造业场景,涉及低延迟、高吞吐的GPU解决方案。

任职要求
硬性条件
1. 技术能力
精通C/C++ 编程,精通CUDA编程模型(线程层次、显存模型及高效使用、Stream/Warp优化),熟悉 Thrust + Cub 并行编程库,具备2年以上GPU代码开发经验。
熟练使用C/C++及Python,熟悉CMake/Makefile编译工具链,熟悉Centos/Linux开发环境,熟悉Docker使用。
深入理解计算机体系机构,熟悉数据结构。
2. 领域经验
至少在一个领域有实战经验:
深度学习: 熟悉TensorRT/TVM/CUTLASS,优化过Transformer/CNN等模型。
图形渲染: 有OptiX/Vulkan等光线投射/追踪开发经验。
科学计算与仿真: 利用CUDA/Thrust库重构核心算法。
3. 专业方向
计算机科学、电子工程、微电子、应用数学等本科及以上学历,发表过相关领域论文者优先。

加分项
熟悉NVIDIA生态工具(如cuDNN,cuBLAS,cuFFT, cuPy,Thrust + Cub 并行编程库)
有多GPU通信优化(NVLink/RDMA)或异构(CPU+GPU+NPU)经验。

技术栈需求
核心语言: CUDA C/C++、 Python (PyCUDA/Numba)

申请方式

1. 个人简历(突出GPU项目量化指标,比如加速比、吞吐量提升)。
2. github开源实现或代码样例(需要包含CUDA核函数实现)
3. 技术博客/论文/专利(如有)
2026-01-28 15:23
IP属地:江苏

职位福利

本科经验不限Linux开发/部署经验C++CPython
企业发布信息图
爱思美智造(上海)半导体有限公司
天使轮 · 0-20人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

C++开发工程师-苏州
3-5万元/月
C/C++3-5年本科C++
苏州 虎丘区
C++开发工程师-苏州
3-5万元/月
C/C++3-5年本科C++
苏州 虎丘区
GUI高级开发工程师
2-3万元/月
C/C++5-10年本科C++QTGUI
苏州 虎丘区
高级嵌入式软件开发工程师
1.8-2.5万元/月
C/C++5-10年本科C语言C++嵌入式开发经验
苏州 虎丘区
EDA开发工程师
4-6万元/月
C/C++5-10年本科C++
苏州 虎丘区
高级EDA软件开发工程师(逻辑综合领域)
5-6万元/月
C/C++5-10年本科C++团队管理经验逻辑综合STL架构设计经验
苏州 虎丘区
开发实习岗位
3000-4000元/月
C/C++经验不限本科
苏州 虎丘区
C++开发工程师-苏州
3-5万元/月
C/C++3-5年本科C++
苏州 虎丘区
C++开发工程师-苏州
1.5-3万元/月
C/C++3-5年本科EDA工具设计与开发
苏州 虎丘区
EDA开发工程师-苏州
4-6万元/月
C/C++5-10年本科EDA工具
苏州 虎丘区