职位详情
职位描述
- 负责大规模分布式AI系统的架构设计、开发与性能优化,保障模型训练与推理任务的高效稳定运行。
- 深度参与AI底层基础设施的研发工作,涵盖计算资源调度、存储系统优化、通信机制加速等关键模块。
- 与算法研发团队密切配合,深入理解模型结构与需求,提供系统层面的性能调优方案及工程化支持。
- 关注技术发展趋势,持续探索异构计算架构、低延迟推理引擎、弹性可扩展训练框架等前沿方向的落地应用。
职位要求
- 计算机、软件工程或相关专业本科及以上学历,具备扎实的编程能力(如C++/Python/Go等)。
- 熟悉主流深度学习框架(如PyTorch/TensorFlow),掌握其计算图原理与运行时执行逻辑。
- 具备分布式系统开发背景,有MPI、NCCL、Ray等通信或任务调度框架使用经验者优先考虑。
- 拥有GPU/TPU等异构计算平台的优化实践经历,熟悉CUDA、TensorRT、Triton推理服务者更具优势。
- 具备较强的系统问题分析与工程实现能力,有大规模系统性能调优实战经验者优先。
- 热爱AI系统技术领域,具备良好的自主学习意识和团队合作素养。
- 负责大规模分布式AI系统的架构设计、开发与性能优化,保障模型训练与推理任务的高效稳定运行。
- 深度参与AI底层基础设施的研发工作,涵盖计算资源调度、存储系统优化、通信机制加速等关键模块。
- 与算法研发团队密切配合,深入理解模型结构与需求,提供系统层面的性能调优方案及工程化支持。
- 关注技术发展趋势,持续探索异构计算架构、低延迟推理引擎、弹性可扩展训练框架等前沿方向的落地应用。
职位要求
- 计算机、软件工程或相关专业本科及以上学历,具备扎实的编程能力(如C++/Python/Go等)。
- 熟悉主流深度学习框架(如PyTorch/TensorFlow),掌握其计算图原理与运行时执行逻辑。
- 具备分布式系统开发背景,有MPI、NCCL、Ray等通信或任务调度框架使用经验者优先考虑。
- 拥有GPU/TPU等异构计算平台的优化实践经历,熟悉CUDA、TensorRT、Triton推理服务者更具优势。
- 具备较强的系统问题分析与工程实现能力,有大规模系统性能调优实战经验者优先。
- 热爱AI系统技术领域,具备良好的自主学习意识和团队合作素养。
2026-05-22 13:01
IP属地:福建厦门
职位福利
本科3-5年深度学习机器学习大模型算法通信算法搜索/推荐算法TensorFlowC++AI性能调优系统开发

诚迈科技股份有限公司
已上市 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











