职位详情
【工作职责】
1.参与大模型管理平台的云原生改造,包括模型生命周期管理、模型监控、模型服务等模块的设计与开发;
2.基于Kubernetes开发CRD+Operator,实现LLM推理池的自动弹性伸缩、多卡调度、GPU拓扑感知与故障迁移;
3.对接GPU池化调度(K8s+KubeVirt+vLLM/SGLang),实现多租户隔离、热迁移、抢占与排队策略;
4.遵循DevOps流程:需求评审→单元测试→PR→CI(GitHubActions)→容器镜像→CD(ArgoCD)→线上可观测(Prometheus/Grafana/Loki)
【工作要求】
1.统招本科及以上学历,计算机、软件工程等相关专业;
2.1–3年后端/云服务开发经验,至少完整参与过1个平台类产品上线;
3.熟练掌握Golang或Python,熟悉常用框架(Gin/Beego/FastAPI等),代码风格良好,单测覆盖率≥60%;
4.掌握常用数据结构、算法、操作系统与网络基础,熟悉Linux日常命令、Shell脚本和容器运行时;
【优先考虑因素】
1.熟悉Docker、Kubernetes基础资源对象(Deployment/Service/ConfigMap/CRD)及Helm模板编写;
2.具备微服务治理经验(熔断、限流、链路追踪、SkyWalking/Prometheus);
3.熟悉GPU调度框架(KubeVirt、Volcano、Koordinator、Hami),或实现过GPU共享/抢占插件;
4.有公有云(AWS、Azure、阿里云、腾讯云)认证或实际使用经验;
1.参与大模型管理平台的云原生改造,包括模型生命周期管理、模型监控、模型服务等模块的设计与开发;
2.基于Kubernetes开发CRD+Operator,实现LLM推理池的自动弹性伸缩、多卡调度、GPU拓扑感知与故障迁移;
3.对接GPU池化调度(K8s+KubeVirt+vLLM/SGLang),实现多租户隔离、热迁移、抢占与排队策略;
4.遵循DevOps流程:需求评审→单元测试→PR→CI(GitHubActions)→容器镜像→CD(ArgoCD)→线上可观测(Prometheus/Grafana/Loki)
【工作要求】
1.统招本科及以上学历,计算机、软件工程等相关专业;
2.1–3年后端/云服务开发经验,至少完整参与过1个平台类产品上线;
3.熟练掌握Golang或Python,熟悉常用框架(Gin/Beego/FastAPI等),代码风格良好,单测覆盖率≥60%;
4.掌握常用数据结构、算法、操作系统与网络基础,熟悉Linux日常命令、Shell脚本和容器运行时;
【优先考虑因素】
1.熟悉Docker、Kubernetes基础资源对象(Deployment/Service/ConfigMap/CRD)及Helm模板编写;
2.具备微服务治理经验(熔断、限流、链路追踪、SkyWalking/Prometheus);
3.熟悉GPU调度框架(KubeVirt、Volcano、Koordinator、Hami),或实现过GPU共享/抢占插件;
4.有公有云(AWS、Azure、阿里云、腾讯云)认证或实际使用经验;
2026-06-29 12:30
IP属地:广东
职位福利
本科1-3年

深圳市恒科拓信息技术有限公司
未融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
软件开发工程师
1.5-3万元/月
Python1-3年本科Java分布式经验DockerPostgreSQLPandasMySQLTornado架构设计经验OracleNumpyKubernetes
北京 海淀区
python开发工程师
1-1.5万元/月
Python3-5年本科ElasticsearchPostgreSQLMySQLKafka接受无前端经验/技能RedisMongoDB
北京 海淀区
python(全程线上+26届可投)
1.2-1.3万元/月
Python经验不限本科留学生优先Linux开发/部署经验接受无前端经验/技能DjangoFlaskMySQL
北京 海淀区
python开发工程师
1.6-2.5万元/月
Python3-5年本科DjangoFlaskSqlNoSQL财务智能平台开发AI项目全流程落地财务数据处理优化
北京 海淀区









