职位详情
岗位职责:
负责数据平台部门的故障运营管理工作,主要包括:牵头组织故障复盘会议、审核故障报告内容、推动故障待办事项落地、基于故障记录构建故障分析数据体系,以及开展稳定性文化建设相关工作(如变更规范、定级标准、红黄线规则等制度的推进与执行)
任职要求:
故障管理与运营经验:
1、具有2年以上在互联网或科技企业从事运维、SRE、技术运营或相关岗位的工作经历。
2、掌握互联网行业故障全生命周期的管理流程,涵盖故障发现、应急处置、升级汇报、事后复盘、整改措施跟踪及闭环管理等环节。
3、曾独立主导或深度参与重大故障复盘过程,熟练运用5Why、根因分析等分析方法进行问题归因。
数据分析与报告能力:
1、具备较强的数据分析和归纳总结能力,能从大量故障数据中识别关键问题、共性规律和发展趋势。
2、可独立完成故障分析报告的撰写、审阅与质量把控,确保报告结构严谨、根因清晰、改进方案具体且具备可操作性。
3、有使用SQL、Excel/Google Sheets等工具进行数据处理的经验,熟悉BI工具(如Tableau)并用于搭建和维护故障数据看板者优先。
技术理解与流程认知:
1、对数据平台常用组件(如Hadoop、Spark、Kafka、Flink、OLAP引擎等)有一定了解,能够理解技术团队在复盘中的专业讨论内容。
2、熟悉软件开发流程与运维体系,对变更管理、监控告警、容量评估、高可用架构等保障系统稳定性的核心领域有扎实认知。
负责数据平台部门的故障运营管理工作,主要包括:牵头组织故障复盘会议、审核故障报告内容、推动故障待办事项落地、基于故障记录构建故障分析数据体系,以及开展稳定性文化建设相关工作(如变更规范、定级标准、红黄线规则等制度的推进与执行)
任职要求:
故障管理与运营经验:
1、具有2年以上在互联网或科技企业从事运维、SRE、技术运营或相关岗位的工作经历。
2、掌握互联网行业故障全生命周期的管理流程,涵盖故障发现、应急处置、升级汇报、事后复盘、整改措施跟踪及闭环管理等环节。
3、曾独立主导或深度参与重大故障复盘过程,熟练运用5Why、根因分析等分析方法进行问题归因。
数据分析与报告能力:
1、具备较强的数据分析和归纳总结能力,能从大量故障数据中识别关键问题、共性规律和发展趋势。
2、可独立完成故障分析报告的撰写、审阅与质量把控,确保报告结构严谨、根因清晰、改进方案具体且具备可操作性。
3、有使用SQL、Excel/Google Sheets等工具进行数据处理的经验,熟悉BI工具(如Tableau)并用于搭建和维护故障数据看板者优先。
技术理解与流程认知:
1、对数据平台常用组件(如Hadoop、Spark、Kafka、Flink、OLAP引擎等)有一定了解,能够理解技术团队在复盘中的专业讨论内容。
2、熟悉软件开发流程与运维体系,对变更管理、监控告警、容量评估、高可用架构等保障系统稳定性的核心领域有扎实认知。
2026-06-11 13:03
IP属地:北京
职位福利
大专1-3年大数据运维经验HadoopKafkaSparkFlink

北京联和利泰科技股份有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
SRE高级运维工程师
1.3-1.9万元/月
运维工程师3-5年本科Linux运维开发/DevOps运维开发经验RedisMongoDBPython/Shell游戏行业KubernetesPython
北京 海淀区









