职位详情
岗位职责:
1. 制定 FAB 工厂 AI 基础设施中长期发展蓝图,涵盖算力集群、分布式存储、高速网络(RoCE/InfiniBand)的架构规划,满足国家级智能制造项目对 AI 算力的技术需求;
2. 主导 AI 专用 GPU/CPU 集群及云原生平台(K8s)的建设实施,完成技术路线选择、资源布局与架构调优,兼顾算力效能、投入成本与合规标准;
3. 建立 AI 基础设施运行管理规范,界定硬件采购、机房运维、网络安全等环节的责任范围,促进跨部门资源整合与协作;
4. 攻关高并发场景下算力集群与大模型分布式训练 / 推理相关的基础设施技术瓶颈,提升系统稳定性与算力使用效率;
5. 构建算力运营评估体系(包括算力利用率、推理响应时间、训练吞吐量、故障恢复周期),统筹团队任务执行,强化成员在算力运维与架构设计方面的专业能力。
任职要求:
1. 本科及以上学历,计算机、网络工程、云计算等相关专业背景,具备 8 年以上 IT 基础设施 / AI 算力架构工作经验,有 3 年以上半导体 / 制造领域算力架构实践者优先;
2. 熟练掌握 GPU 集群(如 NVIDIA A100/H100)、分布式存储与高速网络的架构设计,深入理解 K8s、docker 等云原生技术,具有大规模 AI 算力中心落地项目经验;
3. 了解大模型训练与推理对底层基础设施的需求,具备分布式训练框架(TensorFlow/PyTorch)环境搭建与性能优化能力;
4. 具备出色的团队组织与跨部门协作能力,能够推动国家级项目中基础设施模块的整体规划与实施,拥有算力成本控制与运营实践经验;
5. 熟知半导体行业在数据安全与生产合规方面的规范要求,可设计符合 FAB 工厂特点的高安全性、高可用性 AI 基础设施方案。
1. 制定 FAB 工厂 AI 基础设施中长期发展蓝图,涵盖算力集群、分布式存储、高速网络(RoCE/InfiniBand)的架构规划,满足国家级智能制造项目对 AI 算力的技术需求;
2. 主导 AI 专用 GPU/CPU 集群及云原生平台(K8s)的建设实施,完成技术路线选择、资源布局与架构调优,兼顾算力效能、投入成本与合规标准;
3. 建立 AI 基础设施运行管理规范,界定硬件采购、机房运维、网络安全等环节的责任范围,促进跨部门资源整合与协作;
4. 攻关高并发场景下算力集群与大模型分布式训练 / 推理相关的基础设施技术瓶颈,提升系统稳定性与算力使用效率;
5. 构建算力运营评估体系(包括算力利用率、推理响应时间、训练吞吐量、故障恢复周期),统筹团队任务执行,强化成员在算力运维与架构设计方面的专业能力。
任职要求:
1. 本科及以上学历,计算机、网络工程、云计算等相关专业背景,具备 8 年以上 IT 基础设施 / AI 算力架构工作经验,有 3 年以上半导体 / 制造领域算力架构实践者优先;
2. 熟练掌握 GPU 集群(如 NVIDIA A100/H100)、分布式存储与高速网络的架构设计,深入理解 K8s、docker 等云原生技术,具有大规模 AI 算力中心落地项目经验;
3. 了解大模型训练与推理对底层基础设施的需求,具备分布式训练框架(TensorFlow/PyTorch)环境搭建与性能优化能力;
4. 具备出色的团队组织与跨部门协作能力,能够推动国家级项目中基础设施模块的整体规划与实施,拥有算力成本控制与运营实践经验;
5. 熟知半导体行业在数据安全与生产合规方面的规范要求,可设计符合 FAB 工厂特点的高安全性、高可用性 AI 基础设施方案。
2026-06-06 12:42
IP属地:北京
职位福利
本科5-10年

北方集成电路技术创新中心(北京)有限公司
不需要融资 · 500-999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
软件架构师(WCS/WMS)
8000-9000元/月
架构师3-5年本科C#SCADA、WMS、WCSCOM、UDP、OPC UA大数据架构TCP/IP SockedPHP网络协议
北京 大兴区










