职位详情
岗位职责:
1、承担公司大模型开发平台的后端程序开发与日常运维,持续推进平台架构优化与功能迭代。
2、参与公司大模型开发平台的售前技术支持及定制化二次开发工作。
任职要求:
1.具备5年以上算法开发或平台研发相关工作经验;
2.以下技术能力中至少满足两项:
-熟悉主流大模型训练框架,如DeepSpeed、Llama-factory、ms-swift等,掌握SFT/RLHF/DPO/PT等训练方法,具备分布式训练实践经验,了解RAY等分布式计算框架的应用。
-精通多种大模型推理加速技术,熟悉vLLM、SGLang等加速框架的原理与使用,能够通过参数调优提升推理效率,并具备网络与硬件配置优化经验以增强模型运行性能。
-掌握多模态大模型的训练与推理技术,具有图像视频理解、语音处理、图像生成等相关方向的实际项目经验。
3.熟练使用Python语言,具备扎实的编码能力,理解面向对象设计思想及相关开发模式;
4.熟悉Linux系统常用命令和基础操作,掌握Docker、K8S、Git等开发运维工具;
5.具备良好的学习能力和问题排查能力,能独立完成故障定位与解决;
6.思维活跃,善于发现问题并主动提出产品优化建议。
1、承担公司大模型开发平台的后端程序开发与日常运维,持续推进平台架构优化与功能迭代。
2、参与公司大模型开发平台的售前技术支持及定制化二次开发工作。
任职要求:
1.具备5年以上算法开发或平台研发相关工作经验;
2.以下技术能力中至少满足两项:
-熟悉主流大模型训练框架,如DeepSpeed、Llama-factory、ms-swift等,掌握SFT/RLHF/DPO/PT等训练方法,具备分布式训练实践经验,了解RAY等分布式计算框架的应用。
-精通多种大模型推理加速技术,熟悉vLLM、SGLang等加速框架的原理与使用,能够通过参数调优提升推理效率,并具备网络与硬件配置优化经验以增强模型运行性能。
-掌握多模态大模型的训练与推理技术,具有图像视频理解、语音处理、图像生成等相关方向的实际项目经验。
3.熟练使用Python语言,具备扎实的编码能力,理解面向对象设计思想及相关开发模式;
4.熟悉Linux系统常用命令和基础操作,掌握Docker、K8S、Git等开发运维工具;
5.具备良好的学习能力和问题排查能力,能独立完成故障定位与解决;
6.思维活跃,善于发现问题并主动提出产品优化建议。
2026-07-01 14:49
IP属地:上海
职位福利
本科5-10年大模型分布式训练

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








