职位详情
岗位职责
1.负责大模型日常算法的迭代与优化工作,涵盖指令微调(SFT)、对齐训练(RLHF/RLAIF)、FunctionCall实现及Agent能力提升等方面;
2.结合具体业务场景与需求,推进模型微调与效果验证,持续提升模型在实际任务中的表现能力;
3.优化模型推理效率,通过量化、蒸馏、结构剪枝等手段,确保模型在部署环境下的高性能与稳定运行;
4.参与模型所需数据的全流程构建,包括数据清洗、增强、标注与评估,保障数据质量与覆盖多样性;
5.持续跟进大模型领域前沿技术动态,并将其快速融入现有模型的优化与迭代过程中。
任职要求
1.硕士及以上学历,计算机、人工智能、机器学习等相关专业优先考虑;
2.具备大模型相关项目经验,熟悉指令微调、对齐训练及Agent应用等关键技术方向;
3.掌握Transformer架构及主流优化方法(如GQA、MQA、FlashAttention等);
4.熟练使用至少一种主流大模型训练或推理框架(如Huggingface、DeepSpeed、Megatron、vLLM等),具备多卡或分布式训练经验者优先;
5.熟悉数据预处理流程与任务建模策略,能根据实际需求设计高质量数据集;
6.精通Pytorch等深度学习框架,具备扎实的机器学习与深度学习理论基础;
7.具备较强的代码实现与问题排查能力,可独立完成模型实验设计与迭代优化。
1.负责大模型日常算法的迭代与优化工作,涵盖指令微调(SFT)、对齐训练(RLHF/RLAIF)、FunctionCall实现及Agent能力提升等方面;
2.结合具体业务场景与需求,推进模型微调与效果验证,持续提升模型在实际任务中的表现能力;
3.优化模型推理效率,通过量化、蒸馏、结构剪枝等手段,确保模型在部署环境下的高性能与稳定运行;
4.参与模型所需数据的全流程构建,包括数据清洗、增强、标注与评估,保障数据质量与覆盖多样性;
5.持续跟进大模型领域前沿技术动态,并将其快速融入现有模型的优化与迭代过程中。
任职要求
1.硕士及以上学历,计算机、人工智能、机器学习等相关专业优先考虑;
2.具备大模型相关项目经验,熟悉指令微调、对齐训练及Agent应用等关键技术方向;
3.掌握Transformer架构及主流优化方法(如GQA、MQA、FlashAttention等);
4.熟练使用至少一种主流大模型训练或推理框架(如Huggingface、DeepSpeed、Megatron、vLLM等),具备多卡或分布式训练经验者优先;
5.熟悉数据预处理流程与任务建模策略,能根据实际需求设计高质量数据集;
6.精通Pytorch等深度学习框架,具备扎实的机器学习与深度学习理论基础;
7.具备较强的代码实现与问题排查能力,可独立完成模型实验设计与迭代优化。
2026-05-12 14:37
IP属地:北京
职位福利
硕士经验不限

北京星尘纪元智能科技有限公司
A轮 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









