职位详情
1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等支术对大模型进行微调,满足大模型领域
场景落地需求;
2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性
能,提升大模型落地成效:
3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不
足问题
4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案
任职要求:
1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算;去工作经验
2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型
3、精通大模型微调、自监督学习、注意力机制、Transformer、多多模态学习、模型蒸馏、推理加速等术
4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架
Deepspeed/Megatron等分布式训练框架;
5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题;
6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务:
7、具备超大规模(集群千卡+/大模型100B+)训练、调优经验者优先:
场景落地需求;
2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性
能,提升大模型落地成效:
3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不
足问题
4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案
任职要求:
1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算;去工作经验
2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型
3、精通大模型微调、自监督学习、注意力机制、Transformer、多多模态学习、模型蒸馏、推理加速等术
4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架
Deepspeed/Megatron等分布式训练框架;
5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题;
6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务:
7、具备超大规模(集群千卡+/大模型100B+)训练、调优经验者优先:
2026-03-11 17:03
IP属地:四川成都
职位福利
硕士3-5年

合肥探贤企业管理咨询有限公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










