职位详情
现场硬件故障处理:
及时响应并处置GPU服务器的硬件异常告警,独立完成故障诊断、问题定位及修复实施的完整流程。
熟练掌握GPU卡(如NVIDIA A100/H100, V100, A800等)、主板、CPU、内存、硬盘(NVMe/SSD)、RAID卡、电源模块、网卡(InfiniBand/以太网)等核心组件的检测与更换操作。
精准识别故障根源,规范记录故障表现、处理步骤及根本原因分析(RCA)。
预防性维护(PM):
按计划开展GPU服务器的健康状态检查、固件刷新、驱动升级等预防性维护任务,降低突发故障风险。
配合执行数据中心硬件例行巡检,发现潜在隐患并推动前置化处理。
库存与物流管理:
负责现场备件库(Spare Parts)的日常管理,保障关键部件库存充足,准确登记备件领用与返还信息。
协助推进故障部件的返修(RMA)流程,与供应商开展技术对接与沟通。
及时响应并处置GPU服务器的硬件异常告警,独立完成故障诊断、问题定位及修复实施的完整流程。
熟练掌握GPU卡(如NVIDIA A100/H100, V100, A800等)、主板、CPU、内存、硬盘(NVMe/SSD)、RAID卡、电源模块、网卡(InfiniBand/以太网)等核心组件的检测与更换操作。
精准识别故障根源,规范记录故障表现、处理步骤及根本原因分析(RCA)。
预防性维护(PM):
按计划开展GPU服务器的健康状态检查、固件刷新、驱动升级等预防性维护任务,降低突发故障风险。
配合执行数据中心硬件例行巡检,发现潜在隐患并推动前置化处理。
库存与物流管理:
负责现场备件库(Spare Parts)的日常管理,保障关键部件库存充足,准确登记备件领用与返还信息。
协助推进故障部件的返修(RMA)流程,与供应商开展技术对接与沟通。
2026-06-06 15:00
IP属地:河北张家口
职位福利
学历不限1-3年服务器维修

金石易服(北京)科技有限公司
不需要融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








