职位详情
岗位职责:
1、承担大模型的训练、优化与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品部门推进模型在实际场景中的集成应用,持续优化用户体验,并依据业务需求迭代升级模型能力;
3、参与大规模分布式训练与推理系统的性能调优,高效利用GPU、TPU等加速设备,提升训练与推理效率;
4、构建自动化工具链与标准化流程,提高模型开发、验证及上线的整体运作效率;
5、关注大模型前沿技术进展,及时引入先进方法并落地实践,助力团队技术水平持续提升。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关领域硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFaceTransformers等),具备实际建模与调优经历;
3、精通Python编程,同时具备C++/Java/Go等至少一种语言的开发能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先;
5、对GPU、TPU等硬件加速原理有深刻认知,拥有CUDA编程、TensorRT等性能优化背景者更佳;
6、具备良好的产品意识,能与产品团队协作设计AI应用方案,并推动技术成果的实际转化;
7、具有出色的沟通协调能力和团队协作精神,既能独立承担任务,也能带领团队达成项目目标。
1、承担大模型的训练、优化与部署任务,涵盖模型结构设计、超参数调整及数据清洗处理;
2、协同产品部门推进模型在实际场景中的集成应用,持续优化用户体验,并依据业务需求迭代升级模型能力;
3、参与大规模分布式训练与推理系统的性能调优,高效利用GPU、TPU等加速设备,提升训练与推理效率;
4、构建自动化工具链与标准化流程,提高模型开发、验证及上线的整体运作效率;
5、关注大模型前沿技术进展,及时引入先进方法并落地实践,助力团队技术水平持续提升。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关领域硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFaceTransformers等),具备实际建模与调优经历;
3、精通Python编程,同时具备C++/Java/Go等至少一种语言的开发能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先;
5、对GPU、TPU等硬件加速原理有深刻认知,拥有CUDA编程、TensorRT等性能优化背景者更佳;
6、具备良好的产品意识,能与产品团队协作设计AI应用方案,并推动技术成果的实际转化;
7、具有出色的沟通协调能力和团队协作精神,既能独立承担任务,也能带领团队达成项目目标。
2026-05-25 14:23
IP属地:上海
职位福利
硕士3-5年GolangJavaC++PyTorch量化交易开发经验PythonTensorFlow

上海亚商投资顾问有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











