职位详情
工作职责
1、主导百亿至千亿级参数大模型在地平线芯片上的推理性能优化,提升端到端推理效率至行业领先水平
2、构建地平线UCP加速库并与vLLM等主流框架深度适配,优化KVCache复用与Prefill-Decode分离技术
3、探索长序列推理、多模态大模型等前沿场景的硬件级加速方案
任职要求
1.计算机/电子工程硕士以上学历,精通C/C++、Python语言
2.精通Transformer架构及LLaMA/GPT系列模型推理细节
3.熟悉KV Cache管理、Continuous Batching、Chunked Prefill、Speculative Decoding等常见大模型加速技术
4.具备量化/蒸馏/稀疏化等模型压缩实战经验
5.强烈的技术好奇心和快速学习能力
6.出色的沟通协调能力和团队协作精神
加分项
1.有TensorRT-LLM/vLLM定制化开发经验
2.有机器人/自动驾驶领域SoC优化经验,或寒武纪/昇腾等国产芯片开发经历
1、主导百亿至千亿级参数大模型在地平线芯片上的推理性能优化,提升端到端推理效率至行业领先水平
2、构建地平线UCP加速库并与vLLM等主流框架深度适配,优化KVCache复用与Prefill-Decode分离技术
3、探索长序列推理、多模态大模型等前沿场景的硬件级加速方案
任职要求
1.计算机/电子工程硕士以上学历,精通C/C++、Python语言
2.精通Transformer架构及LLaMA/GPT系列模型推理细节
3.熟悉KV Cache管理、Continuous Batching、Chunked Prefill、Speculative Decoding等常见大模型加速技术
4.具备量化/蒸馏/稀疏化等模型压缩实战经验
5.强烈的技术好奇心和快速学习能力
6.出色的沟通协调能力和团队协作精神
加分项
1.有TensorRT-LLM/vLLM定制化开发经验
2.有机器人/自动驾驶领域SoC优化经验,或寒武纪/昇腾等国产芯片开发经历
2026-05-23 11:30
IP属地:广东深圳
职位福利
本科5-10年

北京地平线信息技术有限公司
C轮 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









