职位详情
工作职责:
负责深度学习模型的封装与工程落地,设计并实现高效、稳定的API服务接口,保障模型在生产环境中的高可用性与可扩展能力。
配合运维团队完成模型在集群环境中的部署,支持高并发场景下的稳定运行,确保系统整体性能与可靠性。
持续优化模型推理效率,运用模型压缩、剪枝、量化等手段降低响应延迟,提升QPS(每秒查询数)。
研究基于消费级显卡(如NVIDIARTX系列)的多卡并行训练与推理加速方案,提高硬件利用率与部署性价比。
参与构建统一的推理服务平台,开发通用型推理加速工具,提升模型服务化与部署流程的自动化水平。
维护模型推理相关技术流程,为业务方提供技术支持,及时响应并解决模型调用过程中的各类问题。跟踪深度学习前沿技术动态,评估其应用价值,并推动落地到实际项目中。
撰写规范、完整的技术文档,保障研发流程的标准化与可追溯性。
任职要求:
计算机科学、人工智能、电子工程或相关领域本科及以上学历。
具备5年以上软件开发经验,编程基础扎实,代码风格良好。
拥有至少2年深度学习项目实战经验,熟练掌握TensorFlow、PyTorch等主流框架。
精通Python及C/C++语言,具备较强的工程实现能力与编码实践经验。
熟悉Linux开发环境,掌握常见设计模式与数据结构,具备良好的编程素养。
了解模型推理优化方法,包括但不限于模型剪枝、量化、算子融合与压缩技术。
具备在消费级GPU上进行多卡并行训练或推理优化的实际经验,能充分发挥硬件性能。
具备优秀的沟通协作能力,积极主动,富有团队精神,学习适应能力强。
具有出色的逻辑思维与问题排查能力,能在高强度环境下保持高效产出。
加分项:
具备大型分布式系统或集群环境下的开发与调优经验。
熟悉Docker、Kubernetes等容器化技术栈。
有开源社区贡献经历或在顶级学术会议发表过相关论文。
负责深度学习模型的封装与工程落地,设计并实现高效、稳定的API服务接口,保障模型在生产环境中的高可用性与可扩展能力。
配合运维团队完成模型在集群环境中的部署,支持高并发场景下的稳定运行,确保系统整体性能与可靠性。
持续优化模型推理效率,运用模型压缩、剪枝、量化等手段降低响应延迟,提升QPS(每秒查询数)。
研究基于消费级显卡(如NVIDIARTX系列)的多卡并行训练与推理加速方案,提高硬件利用率与部署性价比。
参与构建统一的推理服务平台,开发通用型推理加速工具,提升模型服务化与部署流程的自动化水平。
维护模型推理相关技术流程,为业务方提供技术支持,及时响应并解决模型调用过程中的各类问题。跟踪深度学习前沿技术动态,评估其应用价值,并推动落地到实际项目中。
撰写规范、完整的技术文档,保障研发流程的标准化与可追溯性。
任职要求:
计算机科学、人工智能、电子工程或相关领域本科及以上学历。
具备5年以上软件开发经验,编程基础扎实,代码风格良好。
拥有至少2年深度学习项目实战经验,熟练掌握TensorFlow、PyTorch等主流框架。
精通Python及C/C++语言,具备较强的工程实现能力与编码实践经验。
熟悉Linux开发环境,掌握常见设计模式与数据结构,具备良好的编程素养。
了解模型推理优化方法,包括但不限于模型剪枝、量化、算子融合与压缩技术。
具备在消费级GPU上进行多卡并行训练或推理优化的实际经验,能充分发挥硬件性能。
具备优秀的沟通协作能力,积极主动,富有团队精神,学习适应能力强。
具有出色的逻辑思维与问题排查能力,能在高强度环境下保持高效产出。
加分项:
具备大型分布式系统或集群环境下的开发与调优经验。
熟悉Docker、Kubernetes等容器化技术栈。
有开源社区贡献经历或在顶级学术会议发表过相关论文。
2026-06-24 12:33
IP属地:广东深圳
职位福利
本科3-5年C/C++大模型算法多模态算法强化学习模型加速/性能优化Python

深圳水木云清科技有限公司
不需要融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI大模型技术方向实习生
100-150元/天
深度学习经验不限大专语音算法Shell机器学习分布式训练大模型算法自然语言处理算法算法工程化经验强化学习数据挖掘优秀开源项目经历Python
深圳
多模态大模型AI算法(Python)
400-600元/天
深度学习经验不限本科发表算法相关优秀论文Agent机器学习大模型算法自然语言处理算法多模态算法算法工程化经验AI算法RAG强化学习参加算法相关竞赛/获奖Python
深圳









