职位详情
工作职责
1. 负责服务器与算力资源的日常维护(核心任务),确保云平台(阿里云/腾讯云/火山)及自建机房内GPU设备的持续稳定运行。
2. 承担AI推理服务(vLLM、ollama、ComfyUI、SD WebUI等)的部署、版本更新与重启任务,利用nvidia-smi、top等工具监控系统资源,独立定位显存溢出、服务延迟等问题并进行初步处理。
3. 编写shell或Python脚本实现运维流程自动化,减少重复性操作,提高整体工作效率。
4. 参与模型与产品功能测试,验证新模型/版本的prompt输出效果,人工识别图文、视频、对话中的异常情况并记录反馈,必要时通过脚本完成批量测试与结果对比。
5. 协助运营和产品团队完成批量素材生成任务,执行数据采集、基础清洗及标注样本抽查工作。
6. 完成环境打包与镜像复制,快速配置演示环境用于客户或投资人展示,同时参与服务故障的应急响应(包含非工作时间)。
任职要求
1. 熟悉Linux基本操作,掌握cd、ls、tail、grep等常用命令,能使用vi/nano编辑配置文件并独立完成服务启停。
2. 有GPU服务器或AI推理服务实际操作经验(如部署过ollama、SD类服务),能够通过日志分析结合网络搜索解决常见问题(包括英文错误信息)。
3. 态度积极,愿意承担基础运维任务,具备主动学习能力和可靠的执行能力。
4. 优先考虑:具备shell/Python脚本编写能力、使用Docker进行服务部署、了解Midjourney/Stable Diffusion等工具及其prompt设计、参与过模型评测或bad case整理、接触过Prometheus/Grafana或基础告警系统者。
补充说明
1. 工作福利:六险一金、周末双休、深度参与产品决策、接触最新开源模型与框架、期权/股份、开放透明的团队氛围。
1. 负责服务器与算力资源的日常维护(核心任务),确保云平台(阿里云/腾讯云/火山)及自建机房内GPU设备的持续稳定运行。
2. 承担AI推理服务(vLLM、ollama、ComfyUI、SD WebUI等)的部署、版本更新与重启任务,利用nvidia-smi、top等工具监控系统资源,独立定位显存溢出、服务延迟等问题并进行初步处理。
3. 编写shell或Python脚本实现运维流程自动化,减少重复性操作,提高整体工作效率。
4. 参与模型与产品功能测试,验证新模型/版本的prompt输出效果,人工识别图文、视频、对话中的异常情况并记录反馈,必要时通过脚本完成批量测试与结果对比。
5. 协助运营和产品团队完成批量素材生成任务,执行数据采集、基础清洗及标注样本抽查工作。
6. 完成环境打包与镜像复制,快速配置演示环境用于客户或投资人展示,同时参与服务故障的应急响应(包含非工作时间)。
任职要求
1. 熟悉Linux基本操作,掌握cd、ls、tail、grep等常用命令,能使用vi/nano编辑配置文件并独立完成服务启停。
2. 有GPU服务器或AI推理服务实际操作经验(如部署过ollama、SD类服务),能够通过日志分析结合网络搜索解决常见问题(包括英文错误信息)。
3. 态度积极,愿意承担基础运维任务,具备主动学习能力和可靠的执行能力。
4. 优先考虑:具备shell/Python脚本编写能力、使用Docker进行服务部署、了解Midjourney/Stable Diffusion等工具及其prompt设计、参与过模型评测或bad case整理、接触过Prometheus/Grafana或基础告警系统者。
补充说明
1. 工作福利:六险一金、周末双休、深度参与产品决策、接触最新开源模型与框架、期权/股份、开放透明的团队氛围。
2026-06-19 13:46
IP属地:四川成都
职位福利
本科1-3年服务器运维PythonShellDocker

成都时代慧道科技有限公司


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
设备运维技术人员+五险一金13薪
6000-9000元/月
运维工程师经验不限中专/中技桌面运维网络运维系统运维计算机相关专业通信相关专业电子/电气/自动化相关专业
成都 成华区






