职位详情
岗位职责:
1、承担大模型的训练、调优与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品团队推进模型在实际业务场景中的集成应用,优化用户交互体验,并依据需求反馈持续迭代模型性能;
3、参与大规模分布式训练与推理过程的性能提升,高效利用GPU、TPU等计算资源,缩短训练周期并提高推理效率;
4、构建自动化工具链与标准化流程,提升模型开发、验证及上线的整体运作效率;
5、关注大模型方向前沿技术进展,及时引入具备实用价值的新方法,助力团队技术水平持续升级。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关领域硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFace Transformers等),具备实际项目中的建模与优化经验;
3、精通Python编程,同时具备C++/Java/Go其中一种语言的开发能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先考虑;
5、深入理解GPU、TPU等加速硬件原理,拥有CUDA调优、TensorRT等性能优化实操经历;
6、具备良好的产品意识,能与产品侧协作设计AI应用方案,并推动模型成果落地实施;
7、具备出色的沟通协调能力与团队协作素养,既能独立承担任务,也能带领团队达成项目目标。
1、承担大模型的训练、调优与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品团队推进模型在实际业务场景中的集成应用,优化用户交互体验,并依据需求反馈持续迭代模型性能;
3、参与大规模分布式训练与推理过程的性能提升,高效利用GPU、TPU等计算资源,缩短训练周期并提高推理效率;
4、构建自动化工具链与标准化流程,提升模型开发、验证及上线的整体运作效率;
5、关注大模型方向前沿技术进展,及时引入具备实用价值的新方法,助力团队技术水平持续升级。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关领域硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFace Transformers等),具备实际项目中的建模与优化经验;
3、精通Python编程,同时具备C++/Java/Go其中一种语言的开发能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先考虑;
5、深入理解GPU、TPU等加速硬件原理,拥有CUDA调优、TensorRT等性能优化实操经历;
6、具备良好的产品意识,能与产品侧协作设计AI应用方案,并推动模型成果落地实施;
7、具备出色的沟通协调能力与团队协作素养,既能独立承担任务,也能带领团队达成项目目标。
2026-05-17 12:19
IP属地:上海
职位福利
硕士3-5年

上海亚商投资顾问有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










