【北京】AI算力优化技术经理（大模型方向）

3-5万元/月

东城区

陈先生

已实名

企业认证

中电信人工智能科技（北京）有限公司

职位详情

其他技术职位

岗位描述：
1、智算基础设施部署与优化
- 负责AI算力硬件（GPU/NPU集群）及PaaS平台的大规模部署、组网架构设计与性能调优（如RDMA网络优化）
- 主导算力交付的可用性评估，建立性能基线标准并提出针对性优化策略

2、大模型算力选型与适配
- 根据业务场景需求（如训练/推理延迟、吞吐能力、成本控制），为千亿参数级大模型（如DeepSeek 67B/130B）提供算力架构建议（芯片选型/集群配置）及模型精度方案（FP8/BF16/INT8量化）
- 针对主流开源模型（LLaMA、ChatGLM、DeepSeek等）开展算力层面的适配与性能提升

3、算力使用及性能优化
- 负责提升大模型训练与推理的运行效率，牵头并参与性能优化方案的落地实施

任职要求：
1、计算机/电子工程/人工智能等相关专业硕士及以上学历，具备3年以上AI算力基础设施建设或大模型部署调优经验
2、掌握GPU/昇腾910B等AI芯片技术特性，具有实际集群部署经历
3、扎实的编程功底、数据结构与算法基础，熟练掌握Python或C++语言
4、熟悉至少一种主流深度学习框架（PyTorch/TensorFlow/Caffe）
5、具备常见大模型推理框架的设计与部署经验，如vllm、SGLang、TensorRT-llm等
7、具备较强的自主学习意识、内驱动力，良好的沟通协作能力，能适应高强度工作节奏

2026-07-14 14:19

IP属地：北京

职位福利

硕士5-10年NPU昇腾910B算力GPUAI芯片