职位详情
岗位职责:
1、承担大模型的训练、优化与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品团队推进模型在实际业务场景中的集成应用,持续优化用户体验,并依据需求迭代升级模型能力;
3、参与大规模分布式训练与推理过程的性能调优,高效利用GPU、TPU等算力资源,提升训练与推理效率;
4、构建自动化工具链与标准化流程,提高模型开发、验证及上线的整体运作效率;
5、关注大模型前沿技术进展与行业趋势,将先进方法落地于实际项目,助力团队技术水平提升。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关专业硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFace Transformers等),具备实际建模与调参经验;
3、精通Python编程,同时具备C++/Java/Go其中一种语言的开发能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先;
5、深入理解GPU、TPU等加速硬件,拥有CUDA编程、TensorRT等性能优化实操经历;
6、具备良好的产品意识,能与产品侧共同规划AI应用方案,推动模型成果在真实场景中落地实施;
7、具备出色的沟通协作能力与团队领导力,可独立开展工作并带领小组达成项目目标。
1、承担大模型的训练、优化与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品团队推进模型在实际业务场景中的集成应用,持续优化用户体验,并依据需求迭代升级模型能力;
3、参与大规模分布式训练与推理过程的性能调优,高效利用GPU、TPU等算力资源,提升训练与推理效率;
4、构建自动化工具链与标准化流程,提高模型开发、验证及上线的整体运作效率;
5、关注大模型前沿技术进展与行业趋势,将先进方法落地于实际项目,助力团队技术水平提升。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关专业硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFace Transformers等),具备实际建模与调参经验;
3、精通Python编程,同时具备C++/Java/Go其中一种语言的开发能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先;
5、深入理解GPU、TPU等加速硬件,拥有CUDA编程、TensorRT等性能优化实操经历;
6、具备良好的产品意识,能与产品侧共同规划AI应用方案,推动模型成果在真实场景中落地实施;
7、具备出色的沟通协作能力与团队领导力,可独立开展工作并带领小组达成项目目标。
2026-05-22 12:53
IP属地:上海
职位福利
硕士3-5年GolangJavaC++PyTorch量化交易开发经验PythonTensorFlow

上海亚商投资顾问有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











