职位详情
主要职责
负责模型的post-training全流程工作:涵盖数据清洗、模型蒸馏与对齐、模型量化以及特定领域能力增强,持续提升模型综合性能。
提升模型在金融场景任务中的表现:运用多种技术手段,保障模型在实际金融应用中的准确性与稳定性。
构建并落地高效模型优化方案:结合前沿科研成果与技术动态,设计并实施具备高实用性的模型优化方法。
协同数据科学团队开展工作:共同完成数据采集、清洗与标注任务,构建高质量训练与评估数据集。
建立模型性能监控与反馈体系:推动模型在生产环境中的稳定部署,完善性能追踪与迭代反馈机制。
跟进核心技术发展动态:持续关注自然语言处理、计算机视觉及多模态大模型领域的最新研究进展,确保技术路线与时俱进。
输出技术文档与研究报告:系统整理项目成果,撰写详实的技术文档,并向团队及相关方清晰传递关键信息。
职位描述
教育背景:计算机科学、人工智能、电子工程或相关专业硕士及以上学历。
工作经验:具备3年以上多模态大模型优化或相关方向实际工作经验。
技术技能:
具备良好的编程基础,精通Python,熟练使用TensorFlow、PyTorch等主流深度学习框架。
掌握模型post-training相关技术,如数据清洗、模型蒸馏与对齐、模型量化等核心方法。
拥有模型sft、ppo、dpo等训练经验者优先。
加分项:
在相关领域发表过学术论文或拥有技术专利者优先。
负责模型的post-training全流程工作:涵盖数据清洗、模型蒸馏与对齐、模型量化以及特定领域能力增强,持续提升模型综合性能。
提升模型在金融场景任务中的表现:运用多种技术手段,保障模型在实际金融应用中的准确性与稳定性。
构建并落地高效模型优化方案:结合前沿科研成果与技术动态,设计并实施具备高实用性的模型优化方法。
协同数据科学团队开展工作:共同完成数据采集、清洗与标注任务,构建高质量训练与评估数据集。
建立模型性能监控与反馈体系:推动模型在生产环境中的稳定部署,完善性能追踪与迭代反馈机制。
跟进核心技术发展动态:持续关注自然语言处理、计算机视觉及多模态大模型领域的最新研究进展,确保技术路线与时俱进。
输出技术文档与研究报告:系统整理项目成果,撰写详实的技术文档,并向团队及相关方清晰传递关键信息。
职位描述
教育背景:计算机科学、人工智能、电子工程或相关专业硕士及以上学历。
工作经验:具备3年以上多模态大模型优化或相关方向实际工作经验。
技术技能:
具备良好的编程基础,精通Python,熟练使用TensorFlow、PyTorch等主流深度学习框架。
掌握模型post-training相关技术,如数据清洗、模型蒸馏与对齐、模型量化等核心方法。
拥有模型sft、ppo、dpo等训练经验者优先。
加分项:
在相关领域发表过学术论文或拥有技术专利者优先。
2026-05-23 13:06
IP属地:浙江杭州
职位福利
硕士3-5年算法

阿里云计算有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









