端侧大模型算法开发部署

成都·武侯区

重庆志鸿企业管理咨询有限公司

职位详情

"1.负责LLM、VLM等大模型的端侧部署全链路工作，包括但不限于模型转换、压缩、推理加速和性能profiling。
2.主导大模型的微调工作，利用汽车座舱领域数据对基础模型进行指令微调、领域适配，以提升其在车载场景下的表现。
3.研究和实施先进的模型压缩与量化技术，如PTQ、QAT、稀疏化、剪枝等，以显著降低模型对计算、内存和功耗的需求。
4.开发和优化面向特定车载芯片的推理引擎，充分利用NPU、GPU、DSP等硬件加速单元，实现极致的推理性能。
5.构建模型部署和评估的自动化工具链，实现模型从训练到车载部署的高效迭代。
6.与框架团队、应用团队紧密协作，定义模型接口，共同解决端侧AI在集成和运行时遇到的技术挑战。
7.跟踪学术界和工业界在模型轻量化、加速和硬件适配方面的最新进展，并推动其在产品中落地。
任职要求："
"1．计算机科学、人工智能、电子工程或相关专业硕士及以上学历。
2．3年以上机器学习系统或模型部署相关工作经验。
3．硬核技术要求（必须项）：
1）精通PyTorch/TensorFlow等框架，深刻理解其计算图和模型导出机制。
2）精通模型量化、剪枝等模型压缩技术，有实际的PTQ/QAT项目经验，熟悉常见的量化工具。
3）熟悉端侧模型部署工具，如高通QNN/SNPESDK、MTKNeuroPilotSDK等，并能解决部署转换中的复杂问题。
4．加分项（优先考虑）：
1）有LLM、VLM等模型微调经验，熟悉LoRA、QLoRA、P-Tuning等参数高效微调技术。
2）有在座舱CDC端或移动端部署大模型的实际经验。
3）熟悉车载芯片平台（如高通、英伟达、MTK等）的AI加速器架构和编程模型。
4）熟悉C++，具备高性能计算、并行编程的经验。
5）有模型蒸馏或相关经验。
6）具备优秀的问题分析和解决能力，对挑战性技术问题充满激情。"

2026-01-22 16:43

IP属地：重庆

职位福利

本科