职位详情
1、掌握C/C++/Python中至少一门编程语言,具备Golang或Rust技术背景者优先考虑;
2、深入理解GPU工作机制,具备CUDA或Triton编程能力,能够开展GPU性能问题诊断与优化;
3、熟悉NVIDIA及国产GPU、NPU芯片底层架构,具备芯片级问题定位与分析能力;
4、熟练使用Linux系统基本操作与核心原理,掌握常用性能分析与系统调优工具;
5、具有AI领域、大模型研发或相关开源项目实践经验者优先;
6、了解NCCL、nvlink、nvswitch、GDR、RDMA等高速通信技术,具备实际开发应用经验者优先;
7、熟悉业界智能计算平台及机器学习实现方案,了解主流云厂商AI产品特性,有AI开发实践经历者优先;
主要工作方向包括:
1、承担AI智算平台的开发与建设,打造行业领先的集群算力调度、网络管理监控、故障检测与自愈能力;
2、推进异构AI芯片在多任务场景下的资源匹配优化,提升整体算力利用效率;
3、跟踪人工智能领域前沿技术演进,开展深度技术研究,协同产品团队制定AI技术路线与规划;
4、探索自研AI芯片在分布式训练与推理云化方面的应用,构建端到端的一体化解决方案。
2、深入理解GPU工作机制,具备CUDA或Triton编程能力,能够开展GPU性能问题诊断与优化;
3、熟悉NVIDIA及国产GPU、NPU芯片底层架构,具备芯片级问题定位与分析能力;
4、熟练使用Linux系统基本操作与核心原理,掌握常用性能分析与系统调优工具;
5、具有AI领域、大模型研发或相关开源项目实践经验者优先;
6、了解NCCL、nvlink、nvswitch、GDR、RDMA等高速通信技术,具备实际开发应用经验者优先;
7、熟悉业界智能计算平台及机器学习实现方案,了解主流云厂商AI产品特性,有AI开发实践经历者优先;
主要工作方向包括:
1、承担AI智算平台的开发与建设,打造行业领先的集群算力调度、网络管理监控、故障检测与自愈能力;
2、推进异构AI芯片在多任务场景下的资源匹配优化,提升整体算力利用效率;
3、跟踪人工智能领域前沿技术演进,开展深度技术研究,协同产品团队制定AI技术路线与规划;
4、探索自研AI芯片在分布式训练与推理云化方面的应用,构建端到端的一体化解决方案。
2026-05-20 12:19
IP属地:广东深圳
职位福利
本科3-5年NPU虚拟化大模型GPUAI InfraPython

腾讯科技(深圳)有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












