职位详情
岗位职责:
1. 负责公司AI算力与模型服务平台的架构规划与设计(涵盖推理服务、模型管理、资源调度等模块)
2. 构建大模型部署与推理系统架构(如vLLM/TGI等),支持多模型服务化运行
3. 参与GPU资源管理及调度机制设计(基于K8s等容器化平台)
4. 搭建高可用、高并发的AI服务架构,确保系统稳定性和服务等级承诺达成
5. 推动AI能力的商业化实现(包括API开放服务、Token计费等功能)
6. 规划AI平台技术发展路径,推进业务系统(如Agent、交易系统)集成接入
任职要求:
必须:
1. 本科及以上学历,计算机/AI/云计算相关专业优先考虑
2. 具备5年以上分布式系统或平台架构经验(需有高并发API、云平台或数据平台背景)
3. 熟悉容器化与云原生技术栈(Kubernetes / Docker)
4. 有AI类系统实践经验(在RAG / Agent / 模型部署 / 推理服务中至少具备一项)
5. 具备系统级架构设计能力,拥有高可用性与性能调优实战经历
加分项:
1. 具备GPU资源调度或算力平台建设经验(如K8s GPU调度、Slurm等)
2. 掌握主流大模型推理框架(如vLLM / TGI等)
3. 有AI平台或API服务商业化落地经验(如Token计费、SaaS模式)
4. 具备多租户架构与资源隔离设计方案经验
5. 有百卡以上GPU集群或大规模分布式系统的运维与开发经验
1. 负责公司AI算力与模型服务平台的架构规划与设计(涵盖推理服务、模型管理、资源调度等模块)
2. 构建大模型部署与推理系统架构(如vLLM/TGI等),支持多模型服务化运行
3. 参与GPU资源管理及调度机制设计(基于K8s等容器化平台)
4. 搭建高可用、高并发的AI服务架构,确保系统稳定性和服务等级承诺达成
5. 推动AI能力的商业化实现(包括API开放服务、Token计费等功能)
6. 规划AI平台技术发展路径,推进业务系统(如Agent、交易系统)集成接入
任职要求:
必须:
1. 本科及以上学历,计算机/AI/云计算相关专业优先考虑
2. 具备5年以上分布式系统或平台架构经验(需有高并发API、云平台或数据平台背景)
3. 熟悉容器化与云原生技术栈(Kubernetes / Docker)
4. 有AI类系统实践经验(在RAG / Agent / 模型部署 / 推理服务中至少具备一项)
5. 具备系统级架构设计能力,拥有高可用性与性能调优实战经历
加分项:
1. 具备GPU资源调度或算力平台建设经验(如K8s GPU调度、Slurm等)
2. 掌握主流大模型推理框架(如vLLM / TGI等)
3. 有AI平台或API服务商业化落地经验(如Token计费、SaaS模式)
4. 具备多租户架构与资源隔离设计方案经验
5. 有百卡以上GPU集群或大规模分布式系统的运维与开发经验
2026-05-11 12:37
IP属地:广东深圳
职位福利
本科5-10年PythonJavaTypeScript微服务架构容器技术大模型部署与推理架构VLLM/TGI

软通动力信息技术(集团)股份有限公司
已上市 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI架构师(工作地大连)
2.9-3.5万元/月
架构师3-5年本科机器学习深度学习大模型算法TransformerDNNRCNN自然语言处理搜索/推荐算法PyTorch
深圳 龙岗区









