搜索
登录注册

职位详情

工作职责
1、主导百亿至千亿级参数大模型在地平线芯片上的推理性能优化,提升端到端推理效率至行业领先水平
2、构建地平线UCP加速库并与vLLM等主流框架深度适配,优化KVCache复用与Prefill-Decode分离技术
3、探索长序列推理、多模态大模型等前沿场景的硬件级加速方案

任职要求
1.计算机/电子工程硕士以上学历,精通C/C++、Python语言
2.精通Transformer架构及LLaMA/GPT系列模型推理细节
3.熟悉KV Cache管理、Continuous Batching、Chunked Prefill、Speculative Decoding等常见大模型加速技术
4.具备量化/蒸馏/稀疏化等模型压缩实战经验
5.强烈的技术好奇心和快速学习能力
6.出色的沟通协调能力和团队协作精神

加分项
1.有TensorRT-LLM/vLLM定制化开发经验
2.有机器人/自动驾驶领域SoC优化经验,或寒武纪/昇腾等国产芯片开发经历
2026-05-23 11:30
IP属地:广东深圳

职位福利

本科5-10年
企业发布信息图
北京地平线信息技术有限公司
C轮 · 1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

芯片配套工具开发工程师
1.5-4万元/月
C/C++3-5年本科
深圳 坪山区
AI编译器专家
3-6万元/月
C/C++5-10年硕士
深圳 坪山区
AI编译器研发工程师
2-4万元/月
C/C++3-5年本科
深圳 坪山区
qt/c++开发工程师
1-1.3万元/月
C/C++1-3年本科国内院校优先QTC++
深圳 龙岗区 观澜
c++高级软件工程师
1000-10000元/月
C/C++1-3年本科
深圳 宝安区
软件工程师
1.2-2.6万元/月
C/C++3-5年本科
深圳 宝安区
高级c++开发工程师
2.5-3.5万元/月
C/C++10年以上大专
深圳 龙华区 梅林关
c++服务端架构研发
C/C++大专
深圳 龙华区
C++开发工程师
7000-10000元/月
C/C++经验不限本科国内院校优先架构设计经验图形开发经验数据库开发经验MFCSTLC++
深圳 宝安区 新安