职位详情
一、岗位职责专注大语言模型(LLM)的微调(SFT、RLHF)、模型蒸馏、量化压缩技术的研发与实际应用,聚焦冷链物流核心业务场景,设计适配冷链环境的模型微调与蒸馏方案,兼顾模型性能、推理效率与部署成本之间的平衡。
主导大模型微调所需数据集的构建与持续优化,整合冷链物流相关业务数据(如订单、温控、仓储、轨迹等),完成数据清洗、标注及增强处理,针对行业典型问题优化微调策略,提升模型在具体应用场景中的适应能力与准确率。
负责模型蒸馏、量化(INT8/INT4等)、剪枝等关键技术的研究与实现,降低模型体积并提升推理效率,满足冷链SaaS平台、边缘计算设备等多样化部署需求,控制资源消耗与运行成本。
跟踪大模型微调与蒸馏领域的最新进展(如低秩适配、增量微调、知识蒸馏框架等),结合冷链业务特性开展技术预研与验证,推动前沿技术在实际业务中落地转化,助力调度效率提升、货损率下降和响应速度优化。
协同大模型算法、产品及工程团队紧密合作,提供微调与蒸馏环节的技术支持,解决模型上线过程中的性能瓶颈、兼容性问题,保障模型稳定高效地部署至生产系统。
总结大模型微调与蒸馏的技术路径与实践经验,建立标准化方法论和技术规范,促进团队整体技术水平提升,参与技术文档撰写与测试标准制定工作。
二、任职要求
1. 核心要求
学历:本科及以上学历,计算机科学、人工智能、深度学习、数学等相关专业背景;硕士及以上学历,或具备顶会论文、开源项目经验者优先考虑。
经验:2年以上大模型微调(SFT、RLHF)、模型蒸馏相关工作经验,具备完整项目从研发到落地的实践经验;有物流、供应链、冷链等行业模型优化经历者优先。
技术能力:熟练掌握Python编程语言,精通PyTorch、TensorFlow等主流深度学习框架,熟悉常用大模型微调工具(如DeepSpeed、LoRA、QLoRA等)和蒸馏框架(如TinyLlama、DistilBERT等)。
专业知识:深入理解大模型底层机制与Transformer架构,掌握模型微调、蒸馏、量化、剪枝等核心技术,能独立完成方案设计与实现,有效应对实际技术挑战。
数据与工程能力:具备处理大规模异构数据的能力,可独立开展微调数据集的构建与优化工作;了解模型部署技术栈(如Docker、K8s、vllm等),能够配合工程团队推进模型上线。
2. 加分项
具有冷链物流或供应链领域的大模型微调与蒸馏实践经验,熟悉仓储调度、路径规划、温控预警等业务场景,能基于业务需求调整模型优化策略者优先。
有对主流开源大模型(如Qwen、LLaMA、GLM等)进行微调或蒸馏的经验,熟练使用LoRA、QLoRA等高效微调方法,或具备GPTQ、AWQ等模型量化实战经验者优先。
具备模型工程化落地能力,熟悉边缘端部署流程与推理加速技术,能将优化后的模型高效集成到生产环境中者优先。
曾在NeurIPS、ICML、ICLR等顶级AI会议发表过相关论文,或在重要算法竞赛中取得突出成绩者优先。
了解冷链SaaS系统或物流调度平台,具备良好的跨团队协作意识、问题分析能力和技术创新热情,对模型压缩与优化有强烈兴趣。
主导大模型微调所需数据集的构建与持续优化,整合冷链物流相关业务数据(如订单、温控、仓储、轨迹等),完成数据清洗、标注及增强处理,针对行业典型问题优化微调策略,提升模型在具体应用场景中的适应能力与准确率。
负责模型蒸馏、量化(INT8/INT4等)、剪枝等关键技术的研究与实现,降低模型体积并提升推理效率,满足冷链SaaS平台、边缘计算设备等多样化部署需求,控制资源消耗与运行成本。
跟踪大模型微调与蒸馏领域的最新进展(如低秩适配、增量微调、知识蒸馏框架等),结合冷链业务特性开展技术预研与验证,推动前沿技术在实际业务中落地转化,助力调度效率提升、货损率下降和响应速度优化。
协同大模型算法、产品及工程团队紧密合作,提供微调与蒸馏环节的技术支持,解决模型上线过程中的性能瓶颈、兼容性问题,保障模型稳定高效地部署至生产系统。
总结大模型微调与蒸馏的技术路径与实践经验,建立标准化方法论和技术规范,促进团队整体技术水平提升,参与技术文档撰写与测试标准制定工作。
二、任职要求
1. 核心要求
学历:本科及以上学历,计算机科学、人工智能、深度学习、数学等相关专业背景;硕士及以上学历,或具备顶会论文、开源项目经验者优先考虑。
经验:2年以上大模型微调(SFT、RLHF)、模型蒸馏相关工作经验,具备完整项目从研发到落地的实践经验;有物流、供应链、冷链等行业模型优化经历者优先。
技术能力:熟练掌握Python编程语言,精通PyTorch、TensorFlow等主流深度学习框架,熟悉常用大模型微调工具(如DeepSpeed、LoRA、QLoRA等)和蒸馏框架(如TinyLlama、DistilBERT等)。
专业知识:深入理解大模型底层机制与Transformer架构,掌握模型微调、蒸馏、量化、剪枝等核心技术,能独立完成方案设计与实现,有效应对实际技术挑战。
数据与工程能力:具备处理大规模异构数据的能力,可独立开展微调数据集的构建与优化工作;了解模型部署技术栈(如Docker、K8s、vllm等),能够配合工程团队推进模型上线。
2. 加分项
具有冷链物流或供应链领域的大模型微调与蒸馏实践经验,熟悉仓储调度、路径规划、温控预警等业务场景,能基于业务需求调整模型优化策略者优先。
有对主流开源大模型(如Qwen、LLaMA、GLM等)进行微调或蒸馏的经验,熟练使用LoRA、QLoRA等高效微调方法,或具备GPTQ、AWQ等模型量化实战经验者优先。
具备模型工程化落地能力,熟悉边缘端部署流程与推理加速技术,能将优化后的模型高效集成到生产环境中者优先。
曾在NeurIPS、ICML、ICLR等顶级AI会议发表过相关论文,或在重要算法竞赛中取得突出成绩者优先。
了解冷链SaaS系统或物流调度平台,具备良好的跨团队协作意识、问题分析能力和技术创新热情,对模型压缩与优化有强烈兴趣。
2026-05-20 15:14
IP属地:四川成都
职位福利
本科1-3年深度学习强化学习 大模型算法

鲜生活冷链物流有限公司
B轮 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










