职位详情
岗位职责:
1. 负责数据中心GPU服务器集群(CentOS/Ubuntu等Linux系统)的安装部署、日常维护、性能调优及异常问题排查;
2. 规划并落地大规模GPU服务器自动化运维流程,熟练运用PXE、Ansible等工具实现高效管理;
3. 搭建并维护Prometheus+Grafana监控平台,构建涵盖GPU算力、网络、存储等核心指标的监控与预警机制;
4. 根据业务需要, occasional 国内短期出差,协助客户完成现场部署或应对突发故障;
5. 承担7×24小时技术响应任务,支持轮班倒休机制。
任职要求
硬性条件
具备1-3年Linux系统运维背景,精通CentOS/Ubuntu等主流发行版的系统配置与性能优化;
熟悉PXE批量装机原理,具备Ansible自动化运维工具的实际项目经验;
拥有Prometheus+Grafana监控系统的实际部署经历,掌握告警规则设定与系统性能调优能力;
取得RHCE、LFCS、CKA等Linux或云原生领域相关认证者优先;
大专及以上学历,计算机、电子、通信等相关专业毕业。
1. 负责数据中心GPU服务器集群(CentOS/Ubuntu等Linux系统)的安装部署、日常维护、性能调优及异常问题排查;
2. 规划并落地大规模GPU服务器自动化运维流程,熟练运用PXE、Ansible等工具实现高效管理;
3. 搭建并维护Prometheus+Grafana监控平台,构建涵盖GPU算力、网络、存储等核心指标的监控与预警机制;
4. 根据业务需要, occasional 国内短期出差,协助客户完成现场部署或应对突发故障;
5. 承担7×24小时技术响应任务,支持轮班倒休机制。
任职要求
硬性条件
具备1-3年Linux系统运维背景,精通CentOS/Ubuntu等主流发行版的系统配置与性能优化;
熟悉PXE批量装机原理,具备Ansible自动化运维工具的实际项目经验;
拥有Prometheus+Grafana监控系统的实际部署经历,掌握告警规则设定与系统性能调优能力;
取得RHCE、LFCS、CKA等Linux或云原生领域相关认证者优先;
大专及以上学历,计算机、电子、通信等相关专业毕业。
2026-06-29 12:52
IP属地:北京
职位福利
本科1-3年CentOS/RedHat/UbuntuLinux运维经验Ansible/Salt/PuppetZabbix/PrometheusDocker/KubernetesPython/Shell

北京智澜浩宇科技有限公司
不需要融资 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








