职位详情
岗位职责
1、负责 AI 编译器及配套工具链的架构设计、编码实现与持续维护,提升模型在端侧或云端的推理效率与部署能力。
2、深入分析模型部署过程中的性能瓶颈,针对算子融合、内存访问、并行计算、量化策略及指令级优化进行系统性调优。
3、联合芯片与固件研发团队,开展软硬件协同设计与联合验证,推动整体性能优化落地。
4、编写规范化的代码与完整的技术文档,保障测试验证及产线交付的顺利推进。
任职要求
1、计算机、电子工程、机器学习或相关专业本科及以上学历,具备 3 年以上相关领域工作经验。
2、掌握主流处理器架构(GPU/NPU/CPU/FPGA)原理,具备软硬件协同开发经验者优先考虑。
3、熟练掌握 C/C++ 和 Python,具有高性能计算代码开发与深度调优的实际能力。
4、熟悉算子融合机制、访存优化方法、量化技术及并行化策略,能基于扩展指令集完成算子开发。
5、具备良好的沟通协作能力,能够熟练阅读英文技术资料。
加分项
1、具备 MLIR/TVM/IREE 或 LLVM 后端开发经历,或有芯片级验证、大模型部署优化实践经验。
2、参与过重大技术项目并取得可量化的优化成果。
1、负责 AI 编译器及配套工具链的架构设计、编码实现与持续维护,提升模型在端侧或云端的推理效率与部署能力。
2、深入分析模型部署过程中的性能瓶颈,针对算子融合、内存访问、并行计算、量化策略及指令级优化进行系统性调优。
3、联合芯片与固件研发团队,开展软硬件协同设计与联合验证,推动整体性能优化落地。
4、编写规范化的代码与完整的技术文档,保障测试验证及产线交付的顺利推进。
任职要求
1、计算机、电子工程、机器学习或相关专业本科及以上学历,具备 3 年以上相关领域工作经验。
2、掌握主流处理器架构(GPU/NPU/CPU/FPGA)原理,具备软硬件协同开发经验者优先考虑。
3、熟练掌握 C/C++ 和 Python,具有高性能计算代码开发与深度调优的实际能力。
4、熟悉算子融合机制、访存优化方法、量化技术及并行化策略,能基于扩展指令集完成算子开发。
5、具备良好的沟通协作能力,能够熟练阅读英文技术资料。
加分项
1、具备 MLIR/TVM/IREE 或 LLVM 后端开发经历,或有芯片级验证、大模型部署优化实践经验。
2、参与过重大技术项目并取得可量化的优化成果。
2026-06-09 13:59
IP属地:上海
职位福利
本科5-10年

智辰半导体(深圳)有限公司
天使轮 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










