职位详情
岗位职责
1. 负责大模型的常规算法更新与性能提升,涵盖指令微调(SFT)、对齐策略训练(RLHF/RLAIF)、函数调用优化、Agent能力强化等方面;
2. 结合具体业务场景与实际需求,实施模型定制化微调及效果测试,持续提高模型在特定任务中的执行能力;
3. 改进模型推理效率,运用量化、知识蒸馏、结构化剪枝等技术,确保模型在部署环境下的高性能与稳定运行;
4. 参与模型所需数据的全周期管理,包括数据清洗、扩充、标注和质量评估,增强数据集的质量与覆盖广度;
5. 持续关注大模型领域的最新技术动态,并将其高效整合至现有模型的迭代优化过程中。
任职要求
1. 硕士及以上学历,计算机、人工智能、机器学习等相关专业背景优先考虑;
2. 具备大模型项目实践经验,熟悉指令微调、对齐训练、Agent应用等相关方向;
3. 掌握 Transformer 架构及主流优化方法(如 GQA、MQA、FlashAttention 等);
4. 熟练操作至少一种主流大模型训练或推理框架(如 Huggingface、DeepSpeed、Megatron、vLLM 等),具备多卡或分布式训练经验者更佳;
5. 熟悉数据预处理流程与任务建模方式,能根据应用场景构建高质量训练数据集;
6. 精通 Pytorch 等深度学习工具,具备扎实的机器学习与深度学习理论基础;
7. 具备较强的编程实现与问题排查能力,可独立开展模型实验并推进版本迭代。
1. 负责大模型的常规算法更新与性能提升,涵盖指令微调(SFT)、对齐策略训练(RLHF/RLAIF)、函数调用优化、Agent能力强化等方面;
2. 结合具体业务场景与实际需求,实施模型定制化微调及效果测试,持续提高模型在特定任务中的执行能力;
3. 改进模型推理效率,运用量化、知识蒸馏、结构化剪枝等技术,确保模型在部署环境下的高性能与稳定运行;
4. 参与模型所需数据的全周期管理,包括数据清洗、扩充、标注和质量评估,增强数据集的质量与覆盖广度;
5. 持续关注大模型领域的最新技术动态,并将其高效整合至现有模型的迭代优化过程中。
任职要求
1. 硕士及以上学历,计算机、人工智能、机器学习等相关专业背景优先考虑;
2. 具备大模型项目实践经验,熟悉指令微调、对齐训练、Agent应用等相关方向;
3. 掌握 Transformer 架构及主流优化方法(如 GQA、MQA、FlashAttention 等);
4. 熟练操作至少一种主流大模型训练或推理框架(如 Huggingface、DeepSpeed、Megatron、vLLM 等),具备多卡或分布式训练经验者更佳;
5. 熟悉数据预处理流程与任务建模方式,能根据应用场景构建高质量训练数据集;
6. 精通 Pytorch 等深度学习工具,具备扎实的机器学习与深度学习理论基础;
7. 具备较强的编程实现与问题排查能力,可独立开展模型实验并推进版本迭代。
2026-06-26 13:25
IP属地:北京
职位福利
硕士1-3年大模型

北京星尘纪元智能科技有限公司
A轮 · 20-99人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >







