职位详情
职责描述:
1、参与AI算力平台运行环境的搭建与维护,协助完成Kubernetes集群的部署、配置及日常运维工作,确保系统高可用;
2、在指导下通过Kubernetes YAML文件(Deployment、Service、ConfigMap、Secret、PersistentVolume等)实现AI应用的部署、扩缩容与版本升级;
3、参与NVIDIA GPU或NPU等异构计算资源的驱动安装、环境搭建与基础性能验证,保障AI训练与推理任务稳定执行;
4、协助实施系统监控(Prometheus/Grafana)、日志采集(ELK/Fluentd)、数据备份及故障定位,提升平台稳定性与可维护性;
5、编写标准化部署文档、操作流程与故障应对手册,参与团队知识体系构建,促进技术积累与协作效率;
6、协同研发团队优化CI/CD流水线,支持AI模型的高效迭代与发布。
职位要求:
1、本科及以上学历,计算机、软件工程、网络、自动化或相关专业,具备3-5年相关工作经验者优先;
2、掌握Linux基础操作(文件管理、权限控制、进程管理、网络配置),可熟练使用命令行完成系统操作;
3、理解Docker基本原理,能使用docker run、docker-compose up等命令启动和管理容器服务;
4、了解Kubernetes核心概念(Pod、Deployment、Service),具备阅读和修改简单YAML配置文件的能力;
5、熟悉Nginx或Traefik的基础配置,可完成域名绑定、端口映射等常规任务;
6、有NVIDIA GPU驱动、CUDA或Docker安装经验者优先(如课程实践、实验环境部署);
7、具备Git、Shell脚本编写、日志分析等工具使用经验,具有初步自动化运维意识;
8、学习能力突出,责任心强,具备良好沟通能力和团队合作精神,能够积极应对技术挑战
1、参与AI算力平台运行环境的搭建与维护,协助完成Kubernetes集群的部署、配置及日常运维工作,确保系统高可用;
2、在指导下通过Kubernetes YAML文件(Deployment、Service、ConfigMap、Secret、PersistentVolume等)实现AI应用的部署、扩缩容与版本升级;
3、参与NVIDIA GPU或NPU等异构计算资源的驱动安装、环境搭建与基础性能验证,保障AI训练与推理任务稳定执行;
4、协助实施系统监控(Prometheus/Grafana)、日志采集(ELK/Fluentd)、数据备份及故障定位,提升平台稳定性与可维护性;
5、编写标准化部署文档、操作流程与故障应对手册,参与团队知识体系构建,促进技术积累与协作效率;
6、协同研发团队优化CI/CD流水线,支持AI模型的高效迭代与发布。
职位要求:
1、本科及以上学历,计算机、软件工程、网络、自动化或相关专业,具备3-5年相关工作经验者优先;
2、掌握Linux基础操作(文件管理、权限控制、进程管理、网络配置),可熟练使用命令行完成系统操作;
3、理解Docker基本原理,能使用docker run、docker-compose up等命令启动和管理容器服务;
4、了解Kubernetes核心概念(Pod、Deployment、Service),具备阅读和修改简单YAML配置文件的能力;
5、熟悉Nginx或Traefik的基础配置,可完成域名绑定、端口映射等常规任务;
6、有NVIDIA GPU驱动、CUDA或Docker安装经验者优先(如课程实践、实验环境部署);
7、具备Git、Shell脚本编写、日志分析等工具使用经验,具有初步自动化运维意识;
8、学习能力突出,责任心强,具备良好沟通能力和团队合作精神,能够积极应对技术挑战
2026-06-09 13:15
IP属地:天津
职位福利
本科3-5年NginxDockerKubernetesShellgitlinux

深圳市恒双展业科技有限公司
不需要融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
新一代运维实施工程师-国家电网-天津滨海
5000-8000元/月
运维工程师经验不限本科MySQL/OracleLinux系统运维计算机相关专业电子/电气/自动化相关专业运维经验
天津 滨海新区









