职位详情
岗位职责:
1、承担公司大模型开发平台的后端系统开发与日常运维,持续推进平台架构优化与功能迭代。
2、参与大模型开发平台的售前技术支持及定制化二次开发工作。
任职要求:
1.具备5年以上算法开发或平台研发相关工作经验;
2.至少熟练掌握以下两项能力:
-熟悉主流大模型训练框架,如DeepSpeed、Llama-factory、ms-swift等,掌握SFT/RLHF/DPO/PT等训练方法;具备分布式训练实践经验,了解RAY等分布式计算框架的应用。
-精通多种大模型推理加速技术,熟悉vLLM、SGLang等加速工具的技术特点,能够通过参数调优提升推理效率;了解网络与硬件资源配置优化策略,有效提升模型运行性能。
-掌握多模态大模型的训练与推理技术,具备图像视频理解、语音处理、图像生成等相关模型的实际训练与应用经验。
3.熟练使用Python进行开发,具备扎实的编码能力,理解面向对象设计思想及相关开发模式;
4.熟悉Linux环境下的常用命令与基础操作,掌握Docker、K8S、Git等开发运维工具;
5.具有较强的学习能力和问题排查能力,可独立完成问题定位与解决方案实施;
6.思维活跃,善于提出产品优化建议并推动落地。
1、承担公司大模型开发平台的后端系统开发与日常运维,持续推进平台架构优化与功能迭代。
2、参与大模型开发平台的售前技术支持及定制化二次开发工作。
任职要求:
1.具备5年以上算法开发或平台研发相关工作经验;
2.至少熟练掌握以下两项能力:
-熟悉主流大模型训练框架,如DeepSpeed、Llama-factory、ms-swift等,掌握SFT/RLHF/DPO/PT等训练方法;具备分布式训练实践经验,了解RAY等分布式计算框架的应用。
-精通多种大模型推理加速技术,熟悉vLLM、SGLang等加速工具的技术特点,能够通过参数调优提升推理效率;了解网络与硬件资源配置优化策略,有效提升模型运行性能。
-掌握多模态大模型的训练与推理技术,具备图像视频理解、语音处理、图像生成等相关模型的实际训练与应用经验。
3.熟练使用Python进行开发,具备扎实的编码能力,理解面向对象设计思想及相关开发模式;
4.熟悉Linux环境下的常用命令与基础操作,掌握Docker、K8S、Git等开发运维工具;
5.具有较强的学习能力和问题排查能力,可独立完成问题定位与解决方案实施;
6.思维活跃,善于提出产品优化建议并推动落地。
2026-05-17 14:57
IP属地:上海
职位福利
本科5-10年大模型分布式训练

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








