职位详情
"1.负责LLM、VLM等大模型的端侧部署全链路工作,包括但不限于模型转换、压缩、推理加速和性能profiling。
2.主导大模型的微调工作,利用汽车座舱领域数据对基础模型进行指令微调、领域适配,以提升其在车载场景下的表现。
3.研究和实施先进的模型压缩与量化技术,如PTQ、QAT、稀疏化、剪枝等,以显著降低模型对计算、内存和功耗的需求。
4.开发和优化面向特定车载芯片的推理引擎,充分利用NPU、GPU、DSP等硬件加速单元,实现极致的推理性能。
5.构建模型部署和评估的自动化工具链,实现模型从训练到车载部署的高效迭代。
6.与框架团队、应用团队紧密协作,定义模型接口,共同解决端侧AI在集成和运行时遇到的技术挑战。
7.跟踪学术界和工业界在模型轻量化、加速和硬件适配方面的最新进展,并推动其在产品中落地。
任职要求:"
"1.计算机科学、人工智能、电子工程或相关专业硕士及以上学历。
2.3年以上机器学习系统或模型部署相关工作经验。
3.硬核技术要求(必须项):
1)精通PyTorch/TensorFlow等框架,深刻理解其计算图和模型导出机制。
2)精通模型量化、剪枝等模型压缩技术,有实际的PTQ/QAT项目经验,熟悉常见的量化工具。
3)熟悉端侧模型部署工具,如高通QNN/SNPESDK、MTKNeuroPilotSDK等,并能解决部署转换中的复杂问题。
4.加分项(优先考虑):
1)有LLM、VLM等模型微调经验,熟悉LoRA、QLoRA、P-Tuning等参数高效微调技术。
2)有在座舱CDC端或移动端部署大模型的实际经验。
3)熟悉车载芯片平台(如高通、英伟达、MTK等)的AI加速器架构和编程模型。
4)熟悉C++,具备高性能计算、并行编程的经验。
5)有模型蒸馏或相关经验。
6)具备优秀的问题分析和解决能力,对挑战性技术问题充满激情。"
2.主导大模型的微调工作,利用汽车座舱领域数据对基础模型进行指令微调、领域适配,以提升其在车载场景下的表现。
3.研究和实施先进的模型压缩与量化技术,如PTQ、QAT、稀疏化、剪枝等,以显著降低模型对计算、内存和功耗的需求。
4.开发和优化面向特定车载芯片的推理引擎,充分利用NPU、GPU、DSP等硬件加速单元,实现极致的推理性能。
5.构建模型部署和评估的自动化工具链,实现模型从训练到车载部署的高效迭代。
6.与框架团队、应用团队紧密协作,定义模型接口,共同解决端侧AI在集成和运行时遇到的技术挑战。
7.跟踪学术界和工业界在模型轻量化、加速和硬件适配方面的最新进展,并推动其在产品中落地。
任职要求:"
"1.计算机科学、人工智能、电子工程或相关专业硕士及以上学历。
2.3年以上机器学习系统或模型部署相关工作经验。
3.硬核技术要求(必须项):
1)精通PyTorch/TensorFlow等框架,深刻理解其计算图和模型导出机制。
2)精通模型量化、剪枝等模型压缩技术,有实际的PTQ/QAT项目经验,熟悉常见的量化工具。
3)熟悉端侧模型部署工具,如高通QNN/SNPESDK、MTKNeuroPilotSDK等,并能解决部署转换中的复杂问题。
4.加分项(优先考虑):
1)有LLM、VLM等模型微调经验,熟悉LoRA、QLoRA、P-Tuning等参数高效微调技术。
2)有在座舱CDC端或移动端部署大模型的实际经验。
3)熟悉车载芯片平台(如高通、英伟达、MTK等)的AI加速器架构和编程模型。
4)熟悉C++,具备高性能计算、并行编程的经验。
5)有模型蒸馏或相关经验。
6)具备优秀的问题分析和解决能力,对挑战性技术问题充满激情。"
2026-01-22 16:43
IP属地:重庆
职位福利
本科

重庆志鸿企业管理咨询有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI算法模型工程师
2-3万元/月
大模型算法算法工程师5-10年本科深度学习多模态算法LoRa通信算法搜索/推荐算法QLORAPyTorchTensorFlowPython
成都 武侯区











