职位详情
1. 精通GPU服务器技术。
2. GPU集群架构设计:主导基于NVIDIA/A800/H100/H20等GPU服务器的算力方案规划,采用NVLink/NVSwitch实现单机8卡全互联结构,并设计IB/RoCE多机集群网络架构,满足千亿参数大模型训练需求。
3. RDMA网络优化:实施IB/RoCE网络协议栈,结合MPI与NCCL库优化All-Reduce通信性能,保障分布式训练任务高效运行。
4. 国产化方案实施:适配昇腾910A/910B、海光DCU、阿里PPU等国产GPU设备,构建混合RoCE组网架构,解决异构算力资源的兼容问题,完成从NVIDIA生态向国产芯片的技术转型路径设计。
5. 熟悉数据中心网络体系,涵盖以太网及RDMA网络技术。
任职资格:
1. 全日制本科及以上学历,并取得相应学位,大数据、人工智能、计算机、通信等相关专业优先。
2. 3年以上算力/AI/云计算领域售前或解决方案工作经验。
3. 熟悉智能计算中心、千卡级GPU数据中心规划或HPC/AI集群架构设计(如NVIDIA/华为昇腾)。
4. 精通算力集群架构(CPU/GPU/NPU)、高速网络(InfiniBand/RoCE)及资源调度工具(Slurm/K8s)。
5. 持有CCNA或AWS架构师认证者优先考虑。
6. 具备算力项目投标经验者优先。
7. 有大型智算中心建设实践经历者优先。
2. GPU集群架构设计:主导基于NVIDIA/A800/H100/H20等GPU服务器的算力方案规划,采用NVLink/NVSwitch实现单机8卡全互联结构,并设计IB/RoCE多机集群网络架构,满足千亿参数大模型训练需求。
3. RDMA网络优化:实施IB/RoCE网络协议栈,结合MPI与NCCL库优化All-Reduce通信性能,保障分布式训练任务高效运行。
4. 国产化方案实施:适配昇腾910A/910B、海光DCU、阿里PPU等国产GPU设备,构建混合RoCE组网架构,解决异构算力资源的兼容问题,完成从NVIDIA生态向国产芯片的技术转型路径设计。
5. 熟悉数据中心网络体系,涵盖以太网及RDMA网络技术。
任职资格:
1. 全日制本科及以上学历,并取得相应学位,大数据、人工智能、计算机、通信等相关专业优先。
2. 3年以上算力/AI/云计算领域售前或解决方案工作经验。
3. 熟悉智能计算中心、千卡级GPU数据中心规划或HPC/AI集群架构设计(如NVIDIA/华为昇腾)。
4. 精通算力集群架构(CPU/GPU/NPU)、高速网络(InfiniBand/RoCE)及资源调度工具(Slurm/K8s)。
5. 持有CCNA或AWS架构师认证者优先考虑。
6. 具备算力项目投标经验者优先。
7. 有大型智算中心建设实践经历者优先。
2026-06-06 14:42
IP属地:重庆
职位福利
本科3-5年大模型GPU其他类型SaaS/PaaS

北京汉克时代科技有限公司
不需要融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












