职位详情
岗位职责:
1、承担大模型的训练、调优与部署任务,涵盖模型结构设计、超参数优化及数据清洗处理等环节;
2、协同产品团队推进模型在实际场景中的集成应用,持续优化用户体验,并依据业务需求迭代模型能力;
3、参与大规模分布式训练与推理过程的性能提升,高效利用GPU、TPU等计算资源,缩短训练周期并提高推理效率;
4、构建自动化工具链与标准化流程,提升模型开发、验证及上线的整体运作效率;
5、关注大模型前沿技术进展,及时引入具备应用潜力的新方法,助力团队技术水平持续升级。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关领域硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFaceTransformers等),具备真实项目中的模型训练与调参经验;
3、精通Python编程,同时具备C++/Java/Go等至少一种编程语言的基础能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先考虑;
5、深入理解GPU、TPU等加速硬件原理,拥有CUDA编程、TensorRT等性能优化实操经验;
6、具备良好的产品意识,能与产品侧紧密协作设计AI应用方案,并推动模型成果落地实施;
7、具备出色的沟通协调能力与团队协作精神,既能独立担当任务,也能带领小组达成项目目标。
1、承担大模型的训练、调优与部署任务,涵盖模型结构设计、超参数优化及数据清洗处理等环节;
2、协同产品团队推进模型在实际场景中的集成应用,持续优化用户体验,并依据业务需求迭代模型能力;
3、参与大规模分布式训练与推理过程的性能提升,高效利用GPU、TPU等计算资源,缩短训练周期并提高推理效率;
4、构建自动化工具链与标准化流程,提升模型开发、验证及上线的整体运作效率;
5、关注大模型前沿技术进展,及时引入具备应用潜力的新方法,助力团队技术水平持续升级。
任职要求:
1、学历要求:计算机科学、人工智能、数据科学或相关领域硕士及以上学位;
2、掌握主流大模型框架(如TensorFlow、PyTorch、HuggingFaceTransformers等),具备真实项目中的模型训练与调参经验;
3、精通Python编程,同时具备C++/Java/Go等至少一种编程语言的基础能力;
4、了解分布式训练机制与海量数据处理方案,有Megatron、DeepSpeed、Ray等工具实践经验者优先考虑;
5、深入理解GPU、TPU等加速硬件原理,拥有CUDA编程、TensorRT等性能优化实操经验;
6、具备良好的产品意识,能与产品侧紧密协作设计AI应用方案,并推动模型成果落地实施;
7、具备出色的沟通协调能力与团队协作精神,既能独立担当任务,也能带领小组达成项目目标。
2026-06-29 12:55
IP属地:上海
职位福利
硕士3-5年

上海亚商投资顾问有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











