职位详情
阿里云智能-智算安全容器稳定性技术专家-杭州/上海
职位描述
1. 负责阿里云安全容器的线上稳定性体系建设,确保公共云及智算场景下安全容器系统的持续稳定运行;
2. 主导安全容器监控、故障诊断与告警系统的后端开发,保障安全容器在pod、节点、网络及存储层面的高可用能力;
3. 运用数据科学与机器学习方法优化运维流程,推动稳定性运维向自动化、智能化方向升级,提升整体运维效率。
职位要求
1. 具备5年及以上云计算与容器领域研发经验,掌握扎实的计算机系统理论基础,熟练使用Java/Golang/Python进行开发;
2. 熟悉Linux/Unix系统运维(如CentOS、Ubuntu),精通容器技术(Docker、Kubernetes)及云原生相关生态(Helm、Helm Charts、Operator);
3. 掌握主流监控工具(Prometheus、Grafana、Zabbix、Nagios)以及日志分析平台(ELK Stack、Splunk、Datadog);
4. 了解主流公有云平台(AWS、Azure、阿里云、腾讯云等)核心服务(如EC2、S3、Lambda、EKS、RDS、VPC),具备实际云资源管理经验;
5. 对前沿技术有强烈探索欲,富有创新意识,具备良好的沟通协作能力和团队合作精神。
职位描述
1. 负责阿里云安全容器的线上稳定性体系建设,确保公共云及智算场景下安全容器系统的持续稳定运行;
2. 主导安全容器监控、故障诊断与告警系统的后端开发,保障安全容器在pod、节点、网络及存储层面的高可用能力;
3. 运用数据科学与机器学习方法优化运维流程,推动稳定性运维向自动化、智能化方向升级,提升整体运维效率。
职位要求
1. 具备5年及以上云计算与容器领域研发经验,掌握扎实的计算机系统理论基础,熟练使用Java/Golang/Python进行开发;
2. 熟悉Linux/Unix系统运维(如CentOS、Ubuntu),精通容器技术(Docker、Kubernetes)及云原生相关生态(Helm、Helm Charts、Operator);
3. 掌握主流监控工具(Prometheus、Grafana、Zabbix、Nagios)以及日志分析平台(ELK Stack、Splunk、Datadog);
4. 了解主流公有云平台(AWS、Azure、阿里云、腾讯云等)核心服务(如EC2、S3、Lambda、EKS、RDS、VPC),具备实际云资源管理经验;
5. 对前沿技术有强烈探索欲,富有创新意识,具备良好的沟通协作能力和团队合作精神。
2026-06-20 14:35
IP属地:广东深圳
职位福利
硕士5-10年

阿里云计算有限公司
不需要融资 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











