职位详情
岗位核心职责
1、负责GPU算力平台底层调度系统的设计与开发,基于Golang实现分布式任务调度引擎,包括任务优先级排序、GPU资源(算力/显存)动态分配、节点负载均衡及故障自愈逻辑;
2、主导算力平台API网关的架构设计与开发,处理千万级并发请求的路由转发、流量控制(限流/熔断)、身份认证与权限校验,保障网关与调度系统的高效协同;
3、参与GPU集群资源管理模块开发,对接Kubernetes/Docker容器化技术,实现算力资源的细粒度隔离(如MIG/GPUSharing)及弹性伸缩;
优化调度系统与网关的性能瓶颈,通过代码级优化、协议改进(如HTTP/2、gRPC)等方式提升系统吞吐量与响应速度,保障高并发场景下的稳定性;
4、与硬件团队、算法团队协作,将GPU架构特性(如算力调度策略、显存复用)融入底层系统,支撑大模型训练/推理任务的高效运行;
负责系统监控与问题排查体系建设,设计关键指标(如调度延迟、网关错误率)的告警机制,快速响应并解决线上技术问题。
任职要求
1、学历:双一流高校统招本科及以上学历,计算机、软件工程、电子信息等相关专业;
2、经验:3-5年软件开发经验,其中至少3年以上Golang全栈开发经验,有分布式系统或底层中间件开发经历者优先;
3、既往在又拍云、厚德云、慧星云、PPIO工作优先考虑
技术能力:
1、精通Golang并发编程、内存管理及性能调优,熟悉Go语言标准库及常用框架(如Gin、Go-Micro);
2、深入理解分布式系统原理,有底层调度系统(如任务调度、资源管理)或API网关开发经验,熟悉调度算法(如FCFS、优先级调度、负载均衡);
3、熟悉容器化技术(Kubernetes/Docker),了解GPU资源在容器中的调度机制(如nvidia-docker、DevicePlugin);
4、掌握API网关核心技术(如路由转发、限流算法、认证协议OAuth2.0/JWT),有Kong/Traefik二次开发或自定义网关实现经验者优先;
加分项:
1、有AI算力平台、超算中心调度系统开发经验,了解GPU架构(如A100/H100)及算力调度特性;
2、熟悉分布式存储(如Ceph)、消息队列(如Kafka/RabbitMQ)在高并发场景的应用;
3、有开源项目贡献经验(如Kubernetes生态、Golang中间件)。
1、负责GPU算力平台底层调度系统的设计与开发,基于Golang实现分布式任务调度引擎,包括任务优先级排序、GPU资源(算力/显存)动态分配、节点负载均衡及故障自愈逻辑;
2、主导算力平台API网关的架构设计与开发,处理千万级并发请求的路由转发、流量控制(限流/熔断)、身份认证与权限校验,保障网关与调度系统的高效协同;
3、参与GPU集群资源管理模块开发,对接Kubernetes/Docker容器化技术,实现算力资源的细粒度隔离(如MIG/GPUSharing)及弹性伸缩;
优化调度系统与网关的性能瓶颈,通过代码级优化、协议改进(如HTTP/2、gRPC)等方式提升系统吞吐量与响应速度,保障高并发场景下的稳定性;
4、与硬件团队、算法团队协作,将GPU架构特性(如算力调度策略、显存复用)融入底层系统,支撑大模型训练/推理任务的高效运行;
负责系统监控与问题排查体系建设,设计关键指标(如调度延迟、网关错误率)的告警机制,快速响应并解决线上技术问题。
任职要求
1、学历:双一流高校统招本科及以上学历,计算机、软件工程、电子信息等相关专业;
2、经验:3-5年软件开发经验,其中至少3年以上Golang全栈开发经验,有分布式系统或底层中间件开发经历者优先;
3、既往在又拍云、厚德云、慧星云、PPIO工作优先考虑
技术能力:
1、精通Golang并发编程、内存管理及性能调优,熟悉Go语言标准库及常用框架(如Gin、Go-Micro);
2、深入理解分布式系统原理,有底层调度系统(如任务调度、资源管理)或API网关开发经验,熟悉调度算法(如FCFS、优先级调度、负载均衡);
3、熟悉容器化技术(Kubernetes/Docker),了解GPU资源在容器中的调度机制(如nvidia-docker、DevicePlugin);
4、掌握API网关核心技术(如路由转发、限流算法、认证协议OAuth2.0/JWT),有Kong/Traefik二次开发或自定义网关实现经验者优先;
加分项:
1、有AI算力平台、超算中心调度系统开发经验,了解GPU架构(如A100/H100)及算力调度特性;
2、熟悉分布式存储(如Ceph)、消息队列(如Kafka/RabbitMQ)在高并发场景的应用;
3、有开源项目贡献经验(如Kubernetes生态、Golang中间件)。
2026-06-29 12:22
IP属地:浙江
职位福利
本科3-5年GolangDocker计算机相关专业Golang服务端开发经验系统架构设计经验

晨羽智云(杭州)科技有限公司
未融资 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
阿里云智能-容器/云原生/管控技术专家-
4-7万元/月
Golang5-10年本科DockerMySQLGolang服务端开发经验计算机相关专业PythonKubernetes
杭州 西湖区
资深开发工程师
4-7万元/月
Golang5-10年本科JavaDockerMySQLGolang服务端开发经验计算机相关专业中大型项目开发经验系统架构设计经验Kubernetes
杭州 西湖区






