搜索
登录注册

职位详情

岗位职责
1.负责人力资源业务系统的稳定运行保障,涵盖WEB服务、APP后端、API网关及用户行为日志等模块;构建并维护高可用、可扩展的服务架构,提升系统容灾能力与故障恢复效率;
2.设计并落地自动化监控、告警、发布、资源扩缩容等运维机制,深度参与CI/CD流水线的搭建与优化,推进DevOps实践与自动化体系建设;
3.承担大模型训练与推理所依赖的GPU服务器及CPU服务器的日常运维任务,包括环境配置、部署实施、运行监控、故障排查与修复,确保硬件设备持续稳定运行;
4.制定并执行服务器定期巡检方案,记录巡检结果,分析潜在风险点,提前识别性能瓶颈与硬件隐患,及时干预处理,保障服务器资源利用效率最大化;
5.负责企业应用服务的安全防护工作,制定并落实安全策略,涵盖操作系统加固、权限管控、防火墙设置、数据备份与恢复等措施,防范网络攻击和数据泄露风险;
6.实时监控服务器运行状态,跟踪服务响应时间、并发量、错误率等核心指标,服务异常时快速定位根因,协调资源进行应急处置,保障系统可用性与稳定性,缩短中断时间;
7.参与制定服务应急预案,定期开展应急演练,提升团队应对突发故障的能力,确保极端场景下大模型服务可快速恢复;
8.开发运维工具与脚本,编写技术文档并组织内部分享。

任职要求
1.学历与专业:计算机科学与技术、电子信息工程、软件工程等相关专业,具备3年及以上服务器运维或后端开发工作经验;
2.服务器运维能力:了解GPU服务器(NVIDIA系列优先)与CPU服务器的硬件结构与运行原理,掌握常用运维工具(如Ansible、Prometheus、Grafana等)的使用,能独立完成故障诊断与修复;
3.操作系统与网络知识:熟悉Linux系统机制,掌握TCP/IP协议栈,具备网络问题排查能力,了解防火墙、负载均衡等网络设备的配置与应用;
4.编程与工具能力:具备扎实编程基础,熟练掌握至少一种主流语言如C/C++、Python、Shell等;熟悉Docker容器化技术;
5.安全意识与应急处理:具有较强的服务安全意识,了解常见网络安全威胁及防御手段,掌握数据备份与恢复流程;具备良好的应急响应能力,可在系统故障时迅速介入并高效解决;
6.沟通与协作:具备良好沟通表达能力和团队合作精神,能清晰传递技术需求与解决方案,协同跨部门团队推进项目落地;学习能力强,抗压能力好,能快速掌握新技术以应对业务变化与挑战。

加分项:
1.了解vLLM、SGLang等推理框架,具备AI模型部署与运维落地经验;
2.可独立开展服务器性能测试,熟悉软件测试流程与方法
2026-06-24 13:50
IP属地:广东深圳

职位福利

本科3-5年网络运维实施交付运维大数据运维经验系统运维计算机相关专业电子/电气/自动化相关专业网络安全相关经验运维经验
企业发布信息图
深圳市中誉艾科科技有限公司
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

IT技术员
7000-9000元/月
运维工程师1-3年大专Python/Shell
深圳 南山区
运维技术员
2-3.5万元/月
运维工程师3-5年本科
深圳 南山区
业务运维工程师
1.2-1.8万元/月
运维工程师3-5年本科SOCIaaSPaaSSaaS
深圳 南山区
系统运维工程师
1.3-1.8万元/月
运维工程师5-10年大专
深圳 南山区
1191AE-应用运维工程师
运维工程师3-5年本科
深圳 南山区
运维实施工程师
7000-10000元/月
运维工程师1-3年本科软件实施
深圳 南山区
监控系统后台运维工程师
6000-8000元/月
运维工程师1-3年大专监控运维会议系统广播系统
深圳 南山区
IT运维
7000-10000元/月
运维工程师1-3年本科网络运维Java通信相关专业MySQL/Oracle系统运维运维开发经验桌面运维计算机相关专业网络安全相关经验打印机/复印机维修经验IDC机房运维
深圳 南山区
资深云资源运维工程师/团队负责人
3-4万元/月
运维工程师5-10年本科网络运维运维开发经验Python/Shell计算机相关专业电子/电气/自动化相关专业运维经验
深圳 南山区
运维主管
运维工程师
深圳 南山区