职位详情
岗位职责:
1、承担大模型的训练、优化与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品团队推进模型在实际场景中的集成应用,优化用户交互体验,并依据业务需求持续迭代模型能力;
3、参与大规模分布式训练与推理过程的性能调优,高效利用GPU、TPU等计算资源,提升训练与推理效率;
4、构建自动化工具链与标准化流程,提高模型开发、验证及上线的整体运作效率;
5、关注大模型方向前沿技术进展,及时引入具备实用价值的新方法,助力团队技术水平提升。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关专业本科及以上学历;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFace Transformers等),具备实际项目中的训练与调参经验;
3、至少精通Python,同时具备C++/Java/Go等编程语言的基础应用能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先;
5、对GPU、TPU等加速硬件有深刻认知,拥有CUDA编程、TensorRT等性能优化实操经历;
6、具备良好的产品意识,能与产品侧共同规划AI功能方案,并推动模型成果在真实场景中的落地实施;
7、具备出色的沟通协作能力与团队领导力,可独立开展工作并带领成员达成项目目标。
1、承担大模型的训练、优化与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品团队推进模型在实际场景中的集成应用,优化用户交互体验,并依据业务需求持续迭代模型能力;
3、参与大规模分布式训练与推理过程的性能调优,高效利用GPU、TPU等计算资源,提升训练与推理效率;
4、构建自动化工具链与标准化流程,提高模型开发、验证及上线的整体运作效率;
5、关注大模型方向前沿技术进展,及时引入具备实用价值的新方法,助力团队技术水平提升。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关专业本科及以上学历;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFace Transformers等),具备实际项目中的训练与调参经验;
3、至少精通Python,同时具备C++/Java/Go等编程语言的基础应用能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先;
5、对GPU、TPU等加速硬件有深刻认知,拥有CUDA编程、TensorRT等性能优化实操经历;
6、具备良好的产品意识,能与产品侧共同规划AI功能方案,并推动模型成果在真实场景中的落地实施;
7、具备出色的沟通协作能力与团队领导力,可独立开展工作并带领成员达成项目目标。
2026-06-21 14:54
IP属地:上海
职位福利
本科1-3年模型训练大模型

上海亚商投资顾问有限公司
不需要融资 · 500-999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










