职位详情
职责描述:
1. 构建并落地高效、稳定的模型推理与部署架构。
2. 推动大模型在各类生产环境中的集成应用,包括云平台及端侧嵌入式设备等。
3. 提升模型推理性能与资源使用效率,实现系统整体效能优化。
4. 实施常态化运维监控,保障服务的高可用与持续稳定运行。
任职要求:
1. 精通Python/C++/C编程语言。
2. 掌握机器学习与深度学习的核心理论及相关技术。
3. 熟悉主流深度学习框架,如PyTorch等。
4. 具备扎实的数据结构与算法基础,可完成代码层面性能调优。
5. 深入理解模型量化方法,涵盖权重量化、激活量化、混合精度量化等技术。
6. 了解GPU加速原理,熟悉CUDA架构、流多处理器、共享内存等相关概念。
7. 有TensorRT、TVM、Openai Triton、vLLM、llama.cpp、MLC-LLM等工具的实际使用经验。
备注:本岗位预设职级为初级工程师,因平台限制,实际薪资范围可大于平台显示,具体由面试定级决定。
1. 构建并落地高效、稳定的模型推理与部署架构。
2. 推动大模型在各类生产环境中的集成应用,包括云平台及端侧嵌入式设备等。
3. 提升模型推理性能与资源使用效率,实现系统整体效能优化。
4. 实施常态化运维监控,保障服务的高可用与持续稳定运行。
任职要求:
1. 精通Python/C++/C编程语言。
2. 掌握机器学习与深度学习的核心理论及相关技术。
3. 熟悉主流深度学习框架,如PyTorch等。
4. 具备扎实的数据结构与算法基础,可完成代码层面性能调优。
5. 深入理解模型量化方法,涵盖权重量化、激活量化、混合精度量化等技术。
6. 了解GPU加速原理,熟悉CUDA架构、流多处理器、共享内存等相关概念。
7. 有TensorRT、TVM、Openai Triton、vLLM、llama.cpp、MLC-LLM等工具的实际使用经验。
备注:本岗位预设职级为初级工程师,因平台限制,实际薪资范围可大于平台显示,具体由面试定级决定。
2026-06-15 12:52
IP属地:广东深圳
职位福利
本科3-5年vllm互联网/AI

深圳市臻致共创科技合伙企业(有限合伙)
20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >













