职位详情
岗位职责
1 系统稳定性保障:负责核心生产系统的持续稳定运行,承担高可用架构设计、容灾方案实施及容量规划工作,确保服务等级协议(SLA)达成。
2 运维自动化推进:持续推进运维流程的自动化、标准化与平台化建设,降低人工操作依赖,将重复性任务转化为可复用、可扩展的软件工程解决方案。
3 基础设施运维:负责底层计算、存储、网络等基础设施的维护与性能优化,重点覆盖云环境及容器化平台的资源调度与管理。
4 故障响应与根因定位:参与轮班值守机制,对突发系统故障进行及时响应、快速诊断与恢复,并主导事故复盘与根因分析(RCA),制定有效改进措施以避免问题重现。
核心技能要求
1 Linux 系统与脚本开发(精通)
深入掌握 Linux 操作系统机制,熟悉内核、内存管理、IO 调度、网络协议栈等核心模块,具备系统级性能调优和复杂问题排查能力。
熟练运用 grep、awk、sed、strace、tcpdump 等命令行工具,能够高效完成系统状态监控与故障溯源。
具备扎实的 Shell/Bash 脚本编写能力,可独立开发复杂脚本用于系统部署、配置自动化及日常运维操作。
2 编程能力与日志处理(熟悉/了解)
掌握 Python 编程语言,能使用其开发运维工具、API 接口及自动化平台功能模块。
具备通过日志追踪问题的能力,能借助 Python 脚本或日志分析平台(如 ELK Stack 或 Grafana Loki)实现大规模日志的检索、聚合与分析,快速定位应用与业务异常。
3 配置管理工具应用(熟练)
熟练掌握至少一种主流配置管理工具(如 Ansible / SaltStack / Puppet),实现大规模服务器集群的批量配置、部署及环境一致性管控。
4 关键技术领域认知(了解)
了解常见数据库技术:掌握主流关系型数据库(如 MySQL、PostgreSQL)和 NoSQL 数据库(如 Redis、MongoDB)的基本运维要点、高可用架构与性能优化方法。
了解容器相关技术:理解 Docker 容器原理及其生命周期管理,掌握 Kubernetes(K8s)等编排系统的基本概念与部署流程。
了解主流监控体系:具备配置与维护常用监控告警系统(如 Prometheus / Grafana / Zabbix)的能力,可搭建覆盖系统与应用的全方位健康监测体系。
优先条件(加分项)
具备大型高并发互联网系统SRE或运维实战经验者优先。
熟悉 Go、Java 等编程语言者优先考虑。
有 GitOps 实践或可观测性(Observability)落地经验者优先。
拥有公有云(如 AWS、GCP、Azure)或私有云(如 OpenStack)实际运维经历者优先。
1 系统稳定性保障:负责核心生产系统的持续稳定运行,承担高可用架构设计、容灾方案实施及容量规划工作,确保服务等级协议(SLA)达成。
2 运维自动化推进:持续推进运维流程的自动化、标准化与平台化建设,降低人工操作依赖,将重复性任务转化为可复用、可扩展的软件工程解决方案。
3 基础设施运维:负责底层计算、存储、网络等基础设施的维护与性能优化,重点覆盖云环境及容器化平台的资源调度与管理。
4 故障响应与根因定位:参与轮班值守机制,对突发系统故障进行及时响应、快速诊断与恢复,并主导事故复盘与根因分析(RCA),制定有效改进措施以避免问题重现。
核心技能要求
1 Linux 系统与脚本开发(精通)
深入掌握 Linux 操作系统机制,熟悉内核、内存管理、IO 调度、网络协议栈等核心模块,具备系统级性能调优和复杂问题排查能力。
熟练运用 grep、awk、sed、strace、tcpdump 等命令行工具,能够高效完成系统状态监控与故障溯源。
具备扎实的 Shell/Bash 脚本编写能力,可独立开发复杂脚本用于系统部署、配置自动化及日常运维操作。
2 编程能力与日志处理(熟悉/了解)
掌握 Python 编程语言,能使用其开发运维工具、API 接口及自动化平台功能模块。
具备通过日志追踪问题的能力,能借助 Python 脚本或日志分析平台(如 ELK Stack 或 Grafana Loki)实现大规模日志的检索、聚合与分析,快速定位应用与业务异常。
3 配置管理工具应用(熟练)
熟练掌握至少一种主流配置管理工具(如 Ansible / SaltStack / Puppet),实现大规模服务器集群的批量配置、部署及环境一致性管控。
4 关键技术领域认知(了解)
了解常见数据库技术:掌握主流关系型数据库(如 MySQL、PostgreSQL)和 NoSQL 数据库(如 Redis、MongoDB)的基本运维要点、高可用架构与性能优化方法。
了解容器相关技术:理解 Docker 容器原理及其生命周期管理,掌握 Kubernetes(K8s)等编排系统的基本概念与部署流程。
了解主流监控体系:具备配置与维护常用监控告警系统(如 Prometheus / Grafana / Zabbix)的能力,可搭建覆盖系统与应用的全方位健康监测体系。
优先条件(加分项)
具备大型高并发互联网系统SRE或运维实战经验者优先。
熟悉 Go、Java 等编程语言者优先考虑。
有 GitOps 实践或可观测性(Observability)落地经验者优先。
拥有公有云(如 AWS、GCP、Azure)或私有云(如 OpenStack)实际运维经历者优先。
2026-01-13 18:31
IP属地:广东深圳
职位福利
本科3-5年

朵风科技(深圳)有限公司
天使轮 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
区块链运维技术员
1.8-2.7万元/月
运维工程师5-10年大专Golang搜索引擎技术k8s/AWS运维开发/DevOps运维开发经验CI/CDPython/Shell
深圳 南山区









