职位详情
1、负责智算中心的日常运维工作,涵盖现网系统稳定性保障、软件可用性维护、网络安全管理、运维自动化实施以及性能监控与告警响应等任务。
2、依据现网操作流程及服务标准,及时响应并处理线上问题,落实预防措施和容灾机制,确保系统高可用性。
3、根据智算测试规划与技术要求,保障服务器在算力输出、运行性能、网络吞吐能力、读写IO效率、训练速度及模型精度等方面达标。
4、结合项目实际需求,撰写测试报告与性能分析文档,并提出可行性优化方案。
专业知识要求:
1、计算机、软件等相关专业背景,大专及以上学历,熟悉Linux系统与Shell脚本,具备基本开发能力。
2、掌握容器化技术,能熟练应用Docker及Kubernetes进行环境部署与管理。
3、了解算力服务器架构,熟悉NCCL、HCCL通信机制及高性能分布式存储系统。
4、有数据中心、算力中心、人工智能企业或大型大数据平台建设相关经验者优先考虑。
2、依据现网操作流程及服务标准,及时响应并处理线上问题,落实预防措施和容灾机制,确保系统高可用性。
3、根据智算测试规划与技术要求,保障服务器在算力输出、运行性能、网络吞吐能力、读写IO效率、训练速度及模型精度等方面达标。
4、结合项目实际需求,撰写测试报告与性能分析文档,并提出可行性优化方案。
专业知识要求:
1、计算机、软件等相关专业背景,大专及以上学历,熟悉Linux系统与Shell脚本,具备基本开发能力。
2、掌握容器化技术,能熟练应用Docker及Kubernetes进行环境部署与管理。
3、了解算力服务器架构,熟悉NCCL、HCCL通信机制及高性能分布式存储系统。
4、有数据中心、算力中心、人工智能企业或大型大数据平台建设相关经验者优先考虑。
2026-05-05 14:20
IP属地:广东深圳
职位福利
大专经验不限系统运维运维开发/DevOps

深圳市众云网有限公司
不需要融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
高级运维工程师
3-5万元/月
运维工程师5-10年大专Python/ShellMySQL/Oracle网络运维系统运维运维开发/DevOps实施交付运维计算机相关专业运维经验运维开发经验大数据运维经验
深圳 南山区 南头












