职位详情
985/211全日制本科 优先
工作职责
1、承担AI推理平台的构建与运维,打造高吞吐、低延迟、高可用的AI推理服务体系;
2、主导异构芯片环境下的AI资源调度系统开发,降低用户使用门槛,实现即插即用;
3、聚焦大模型与国产GPU的兼容适配及性能优化(包括Kernel优化、编译优化、显存优化等);
4、持续提升AI推理平台中k8s相关组件的性能表现与系统稳定性;
任职资格
1. 硕士及以上学历,计算机、数学、电子信息技术等相关专业,具备5年以上AI平台架构设计与开发经验;
2. 具有MaaS架构实践经验,熟悉大规模模型部署、服务治理、监控告警等功能模块的设计与实现,有成功落地大型项目者优先;
3. 精通docker、Kubernetes以及主流微服务架构技术;
4. 掌握C/C++/Python/Golang中至少一门编程语言,了解vllm、nvidia triton server等推理加速框架,熟悉Pytorch、Tensorflow等至少两个主流AI框架;
5. 拥有丰富的AI模型训练与推理加速算法经验,具备异构环境下算法调优能力者优先;
6. 能独立设计面向高可用、高并发、容灾备份等复杂场景的系统架构;
7. 学习能力强,对前沿技术保持热情,具备主动推进工作的驱动力;
8. 具备良好的沟通表达能力,责任心强,富有团队合作精神;
工作职责
1、承担AI推理平台的构建与运维,打造高吞吐、低延迟、高可用的AI推理服务体系;
2、主导异构芯片环境下的AI资源调度系统开发,降低用户使用门槛,实现即插即用;
3、聚焦大模型与国产GPU的兼容适配及性能优化(包括Kernel优化、编译优化、显存优化等);
4、持续提升AI推理平台中k8s相关组件的性能表现与系统稳定性;
任职资格
1. 硕士及以上学历,计算机、数学、电子信息技术等相关专业,具备5年以上AI平台架构设计与开发经验;
2. 具有MaaS架构实践经验,熟悉大规模模型部署、服务治理、监控告警等功能模块的设计与实现,有成功落地大型项目者优先;
3. 精通docker、Kubernetes以及主流微服务架构技术;
4. 掌握C/C++/Python/Golang中至少一门编程语言,了解vllm、nvidia triton server等推理加速框架,熟悉Pytorch、Tensorflow等至少两个主流AI框架;
5. 拥有丰富的AI模型训练与推理加速算法经验,具备异构环境下算法调优能力者优先;
6. 能独立设计面向高可用、高并发、容灾备份等复杂场景的系统架构;
7. 学习能力强,对前沿技术保持热情,具备主动推进工作的驱动力;
8. 具备良好的沟通表达能力,责任心强,富有团队合作精神;
2026-06-26 14:02
IP属地:浙江杭州
职位福利
硕士5-10年C/C++分布式训练K8s大模型算法自然语言处理算法多模态算法国内院校优先Ai推理模型加速/性能优化Python

杭州齐芯智光科技有限责任公司
B轮 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI平台高级工程师
2.5-4.5万元/月
深度学习5-10年硕士C/C++分布式训练K8s大模型算法自然语言处理算法多模态算法国内院校优先Ai推理模型加速/性能优化Python
杭州 滨江区
AI专家-远程办公-web3
1.5-3万元/月
深度学习3-5年硕士发表算法相关优秀论文C/C++团队管理经验机器学习图像算法大模型算法自然语言处理算法算法工程化经验强化学习参加算法相关竞赛/获奖优秀开源项目经历Python
杭州 滨江区
深度学习高级算法工程师
3-6万元/月
深度学习算法工程师1-3年硕士Java大模型算法自然语言处理算法算法工程化经验其他推荐算法发表算法相关优秀论文C/C++算法机器学习自然语言处理参加算法相关竞赛/获奖数据挖掘Python
杭州 滨江区









