搜索
登录注册

职位详情

岗位核心职责
1、负责GPU算力平台底层调度系统的设计与开发,基于Golang实现分布式任务调度引擎,包括任务优先级排序、GPU资源(算力/显存)动态分配、节点负载均衡及故障自愈逻辑;
2、主导算力平台API网关的架构设计与开发,处理千万级并发请求的路由转发、流量控制(限流/熔断)、身份认证与权限校验,保障网关与调度系统的高效协同;
3、参与GPU集群资源管理模块开发,对接Kubernetes/Docker容器化技术,实现算力资源的细粒度隔离(如MIG/GPUSharing)及弹性伸缩;
优化调度系统与网关的性能瓶颈,通过代码级优化、协议改进(如HTTP/2、gRPC)等方式提升系统吞吐量与响应速度,保障高并发场景下的稳定性;
4、与硬件团队、算法团队协作,将GPU架构特性(如算力调度策略、显存复用)融入底层系统,支撑大模型训练/推理任务的高效运行;
负责系统监控与问题排查体系建设,设计关键指标(如调度延迟、网关错误率)的告警机制,快速响应并解决线上技术问题。

任职要求
1、学历:双一流高校统招本科及以上学历,计算机、软件工程、电子信息等相关专业;
2、经验:3-5年软件开发经验,其中至少3年以上Golang全栈开发经验,有分布式系统或底层中间件开发经历者优先;
3、既往在又拍云、厚德云、慧星云、PPIO工作优先考虑

技术能力:
1、精通Golang并发编程、内存管理及性能调优,熟悉Go语言标准库及常用框架(如Gin、Go-Micro);
2、深入理解分布式系统原理,有底层调度系统(如任务调度、资源管理)或API网关开发经验,熟悉调度算法(如FCFS、优先级调度、负载均衡);
3、熟悉容器化技术(Kubernetes/Docker),了解GPU资源在容器中的调度机制(如nvidia-docker、DevicePlugin);
4、掌握API网关核心技术(如路由转发、限流算法、认证协议OAuth2.0/JWT),有Kong/Traefik二次开发或自定义网关实现经验者优先;

加分项:
1、有AI算力平台、超算中心调度系统开发经验,了解GPU架构(如A100/H100)及算力调度特性;
2、熟悉分布式存储(如Ceph)、消息队列(如Kafka/RabbitMQ)在高并发场景的应用;
3、有开源项目贡献经验(如Kubernetes生态、Golang中间件)。
2026-06-29 12:22
IP属地:浙江

职位福利

本科3-5年GolangDocker计算机相关专业Golang服务端开发经验系统架构设计经验
企业发布信息图
晨羽智云(杭州)科技有限公司
未融资 · 20-99人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

异构计算开发工程师
3-5万元/月
Golang3-5年本科调度Dockerai+infragpuKubernetes
杭州 西湖区
数据库管控高级开发工程师-杭州/北京
2.5-5万元/月
Golang3-5年本科JavaC++计算机相关专业
杭州 西湖区
数据安全与系统后端开发-杭州
3.5-6.5万元/月
Golang3-5年本科C++C语言计算机相关专业存储 C++
杭州 西湖区
后端开发工程师
1.5-2万元/月
Golang3-5年本科Golang服务端开发经验AIGC计算机相关专业
杭州 西湖区
赵先生 · 晨羽3日内活跃
Golang
1.8-2.5万元/月
Golang3-5年本科PPIODocker底层调度又拍云计算机相关专业系统架构设计经验GPU网关API
杭州 西湖区
赵先生 · 晨羽3日内活跃
容器开发工程师/专家-杭州/北京/深圳
2.5-5万元/月
Golang3-5年本科Golang服务端开发经验计算机相关专业中大型项目开发经验
杭州 西湖区
阿里云智能-容器镜像服务资深研发工程师
2.5-4万元/月
Golang3-5年本科
杭州 西湖区
分布式研发工程师-资源调度-北京/杭州
2.5-5万元/月
Golang3-5年本科Java计算机相关专业中大型项目开发经验Kubernetes
杭州 西湖区
阿里云智能-容器/云原生/管控技术专家-
4-7万元/月
Golang5-10年本科DockerMySQLGolang服务端开发经验计算机相关专业PythonKubernetes
杭州 西湖区
资深开发工程师
4-7万元/月
Golang5-10年本科JavaDockerMySQLGolang服务端开发经验计算机相关专业中大型项目开发经验系统架构设计经验Kubernetes
杭州 西湖区