职位详情
岗位描述:
1、智算基础设施部署与优化
- 负责AI算力硬件(GPU/NPU集群)及PaaS平台的大规模部署、组网架构设计与性能调优(如RDMA网络优化)
- 主导算力交付的可用性评估,建立性能基线标准并提出针对性优化策略
2、大模型算力选型与适配
- 根据业务场景需求(如训练/推理延迟、吞吐能力、成本控制),为千亿参数级大模型(如DeepSeek 67B/130B)提供算力架构建议(芯片选型/集群配置)及模型精度方案(FP8/BF16/INT8量化)
- 针对主流开源模型(LLaMA、ChatGLM、DeepSeek等)开展算力层面的适配与性能提升
3、算力使用及性能优化
- 负责提升大模型训练与推理的运行效率,牵头并参与性能优化方案的落地实施
任职要求:
1、计算机/电子工程/人工智能等相关专业硕士及以上学历,具备3年以上AI算力基础设施建设或大模型部署调优经验
2、掌握GPU/昇腾910B等AI芯片技术特性,具有实际集群部署经历
3、扎实的编程功底、数据结构与算法基础,熟练掌握Python或C++语言
4、熟悉至少一种主流深度学习框架(PyTorch/TensorFlow/Caffe)
5、具备常见大模型推理框架的设计与部署经验,如vllm、SGLang、TensorRT-llm等
7、具备较强的自主学习意识、内驱动力,良好的沟通协作能力,能适应高强度工作节奏
1、智算基础设施部署与优化
- 负责AI算力硬件(GPU/NPU集群)及PaaS平台的大规模部署、组网架构设计与性能调优(如RDMA网络优化)
- 主导算力交付的可用性评估,建立性能基线标准并提出针对性优化策略
2、大模型算力选型与适配
- 根据业务场景需求(如训练/推理延迟、吞吐能力、成本控制),为千亿参数级大模型(如DeepSeek 67B/130B)提供算力架构建议(芯片选型/集群配置)及模型精度方案(FP8/BF16/INT8量化)
- 针对主流开源模型(LLaMA、ChatGLM、DeepSeek等)开展算力层面的适配与性能提升
3、算力使用及性能优化
- 负责提升大模型训练与推理的运行效率,牵头并参与性能优化方案的落地实施
任职要求:
1、计算机/电子工程/人工智能等相关专业硕士及以上学历,具备3年以上AI算力基础设施建设或大模型部署调优经验
2、掌握GPU/昇腾910B等AI芯片技术特性,具有实际集群部署经历
3、扎实的编程功底、数据结构与算法基础,熟练掌握Python或C++语言
4、熟悉至少一种主流深度学习框架(PyTorch/TensorFlow/Caffe)
5、具备常见大模型推理框架的设计与部署经验,如vllm、SGLang、TensorRT-llm等
7、具备较强的自主学习意识、内驱动力,良好的沟通协作能力,能适应高强度工作节奏
2026-05-25 14:59
IP属地:北京
职位福利
硕士5-10年NPU昇腾910B算力GPUAI芯片

中电信人工智能科技(北京)有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








