职位详情
职位描述:
负责将主流开源大模型(DeepSeek/
LLaMA/Qwen/ChatGLM等)及小模型
(ResNet50、 BERT-Base/Large, YOLOv5/v8、Stable Diffusion等)快速迁移并高效部署到公司自研AI芯片与板卡上;
,基于自研AI编译器(含图优化、算子自动生成、低比特量化、内存调度、流水并行等)完成模型端到端编译;
·基于精度分析工具分析定位分析精度损失点;分析和优化模型在芯片上的性能瓶颈(计算、访存、带宽等),并实施优化策略以提升性能;开发和维护相关的模型转换、调试、精度和性能分析工具,支持内部和客户的高效开发与部署;
跟踪LLM推理前沿技术(PagedAttention、Speculative Decoding, ContinuousBatching、MoE offloading等),输出性能Benchmark与落地方案;
必备条件
,计算机/电子/自动化相关专业,本科及以上学历,有AI框架或编译器开发经验;
·深入掌握至少一种AI框架源码(PyTorch2.x、TensorRT、ONNX Runtime、TVM、MLIR、XLA);
熟悉GPU/NPU体系结构,理解Tensor
Core / Matrix Core /Systolic Array 原理, 用PTX/SASS或NPU汇编做性能剖析;
·具备大模型分布式推理/训练经验:
DeepSpeed, Megatron-LM、 Colossal-AI,
VLLM等
熟练掌握C++/Python,具备CUDA/
OpenCL/Triton/HIP/SPIR-V中至少一种内核开发经验;
熟悉常用CV/NLP模型结构及算子分解,能独立搭建 ResNet50/BERT-Large/StableDiffusion全链路 Demo;
,具备强烈的性能优化意识,能用NSight/Perfetto/自研Profiler进行Roofline分析,定位瓶颈并给出2x以上提升方案。
加分项
有LLM量化、稀疏化、MoE结构落地经验;参与过AI编译器前端(TorchScript/FX、ONNX、MHLO、StableHLO)或后端(LLVM、MLIR Dialect) 开发;
熟悉RISC-V Vector Extension或自研ISA指令集;
负责将主流开源大模型(DeepSeek/
LLaMA/Qwen/ChatGLM等)及小模型
(ResNet50、 BERT-Base/Large, YOLOv5/v8、Stable Diffusion等)快速迁移并高效部署到公司自研AI芯片与板卡上;
,基于自研AI编译器(含图优化、算子自动生成、低比特量化、内存调度、流水并行等)完成模型端到端编译;
·基于精度分析工具分析定位分析精度损失点;分析和优化模型在芯片上的性能瓶颈(计算、访存、带宽等),并实施优化策略以提升性能;开发和维护相关的模型转换、调试、精度和性能分析工具,支持内部和客户的高效开发与部署;
跟踪LLM推理前沿技术(PagedAttention、Speculative Decoding, ContinuousBatching、MoE offloading等),输出性能Benchmark与落地方案;
必备条件
,计算机/电子/自动化相关专业,本科及以上学历,有AI框架或编译器开发经验;
·深入掌握至少一种AI框架源码(PyTorch2.x、TensorRT、ONNX Runtime、TVM、MLIR、XLA);
熟悉GPU/NPU体系结构,理解Tensor
Core / Matrix Core /Systolic Array 原理, 用PTX/SASS或NPU汇编做性能剖析;
·具备大模型分布式推理/训练经验:
DeepSpeed, Megatron-LM、 Colossal-AI,
VLLM等
熟练掌握C++/Python,具备CUDA/
OpenCL/Triton/HIP/SPIR-V中至少一种内核开发经验;
熟悉常用CV/NLP模型结构及算子分解,能独立搭建 ResNet50/BERT-Large/StableDiffusion全链路 Demo;
,具备强烈的性能优化意识,能用NSight/Perfetto/自研Profiler进行Roofline分析,定位瓶颈并给出2x以上提升方案。
加分项
有LLM量化、稀疏化、MoE结构落地经验;参与过AI编译器前端(TorchScript/FX、ONNX、MHLO、StableHLO)或后端(LLVM、MLIR Dialect) 开发;
熟悉RISC-V Vector Extension或自研ISA指令集;
2026-06-27 12:26
IP属地:广东
职位福利
硕士1-3年PyTorch、TensorFlow、J

深圳亚讯企业管理顾问有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >







