职位详情
【工作职责】
1. 参与大模型管理平台的云原生架构升级,负责模型生命周期管控、监控体系构建及模型服务模块的技术实现;
2. 基于 Kubernetes 设计并开发 CRD 与 Operator,支撑 LLM 推理集群的自动扩缩容、多GPU卡资源调度、拓扑感知分配及故障自愈能力;
3. 集成 GPU 资源池化方案(K8s + KubeVirt + vLLM / SGLang),实现多租户环境下的资源隔离、服务热迁移、任务抢占和队列调度机制;
4. 落实 DevOps 实践流程:从需求分析 → 单元测试 → 代码评审 → CI(GitHub Actions)→ 镜像构建 → CD(ArgoCD)→ 生产环境可观测性(Prometheus/Grafana/Loki)
【工作要求】
1. 本科及以上学历,计算机科学、软件工程或相关专业背景;
2. 具备1–3年后端或云平台开发经验,至少完整参与过1个平台类产品的上线交付过程;
3. 精通 Golang 或 Python 编程语言,掌握主流框架(如 Gin / Beego / FastAPI 等),编码规范良好,单元测试覆盖率达到60%以上;
4. 熟悉常见数据结构与算法、操作系统原理及网络基础知识,熟练使用 Linux 常用命令、Shell 脚本及容器运行时技术;
【优先考虑因素】
1. 掌握 Docker、Kubernetes 核心资源对象(Deployment / Service / ConfigMap / CRD)及 Helm 模板编写能力;
2. 有微服务治理实践经验(如熔断、限流、链路追踪、SkyWalking/Prometheus 等工具应用);
3. 了解 GPU 调度生态(KubeVirt、Volcano、Koordinator、Hami),或曾开发 GPU 资源共享/抢占类插件;
4. 拥有公有云平台(AWS、Azure、阿里云、腾讯云)认证资质或实际项目使用经验;
1. 参与大模型管理平台的云原生架构升级,负责模型生命周期管控、监控体系构建及模型服务模块的技术实现;
2. 基于 Kubernetes 设计并开发 CRD 与 Operator,支撑 LLM 推理集群的自动扩缩容、多GPU卡资源调度、拓扑感知分配及故障自愈能力;
3. 集成 GPU 资源池化方案(K8s + KubeVirt + vLLM / SGLang),实现多租户环境下的资源隔离、服务热迁移、任务抢占和队列调度机制;
4. 落实 DevOps 实践流程:从需求分析 → 单元测试 → 代码评审 → CI(GitHub Actions)→ 镜像构建 → CD(ArgoCD)→ 生产环境可观测性(Prometheus/Grafana/Loki)
【工作要求】
1. 本科及以上学历,计算机科学、软件工程或相关专业背景;
2. 具备1–3年后端或云平台开发经验,至少完整参与过1个平台类产品的上线交付过程;
3. 精通 Golang 或 Python 编程语言,掌握主流框架(如 Gin / Beego / FastAPI 等),编码规范良好,单元测试覆盖率达到60%以上;
4. 熟悉常见数据结构与算法、操作系统原理及网络基础知识,熟练使用 Linux 常用命令、Shell 脚本及容器运行时技术;
【优先考虑因素】
1. 掌握 Docker、Kubernetes 核心资源对象(Deployment / Service / ConfigMap / CRD)及 Helm 模板编写能力;
2. 有微服务治理实践经验(如熔断、限流、链路追踪、SkyWalking/Prometheus 等工具应用);
3. 了解 GPU 调度生态(KubeVirt、Volcano、Koordinator、Hami),或曾开发 GPU 资源共享/抢占类插件;
4. 拥有公有云平台(AWS、Azure、阿里云、腾讯云)认证资质或实际项目使用经验;
2026-06-26 13:54
IP属地:北京
职位福利
本科3-5年Docker接受无数字后端工程师经验大模型Helm 模板Kubernetes微服务治理经验

北京思普艾斯科技有限公司
不需要融资 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
数字后端(1-5年本科 10hc ,tl 1个hc,小工艺经验)
13-15万元/月
数字后端工程师1-3年本科有数字后端工程师经验ASICSoCCPUGPU7nm以下16nm-7nmTCLPerlPythonShellMake
北京 丰台区 西客站









