职位详情
岗位职责:
1.主导大模型项目(如企业私有化部署、行业大模型应用、RAG系统、多模态理解等)的技术方案设计与实施交付;
2.负责大模型推理部署(GPU资源调度、分布式推理、模型加速)、API服务封装及业务系统集成;
3.统筹算法、后端、数据、前端等团队协作,保障项目按时高质量交付;
4.编写并审核技术方案、部署文档、接口说明、POC报告等项目交付资料;
5.深入客户实际应用场景,参与需求调研、方案讲解与技术答疑,提升客户认可度;
任职要求:
1.计算机、人工智能、软件工程等相关专业背景;
2.3年以上后端或AI项目开发经验,熟练掌握Python,具备大模型或分布式系统实践经验者优先;
3.掌握主流大模型架构及部署工具,如LLaMA/DeepSeek/Baichuan、vLLM、TGI、FastChat、Deepspeed、HuggingFaceTransformers等;
4.熟悉RAG检索增强生成、KVCache机制、推理优化、分布式训练/推理等核心技术;
5.具备项目交付经历,了解模型上线、效果评估、性能调优等落地环节者优先;
6.能够接受出差安排。
1.主导大模型项目(如企业私有化部署、行业大模型应用、RAG系统、多模态理解等)的技术方案设计与实施交付;
2.负责大模型推理部署(GPU资源调度、分布式推理、模型加速)、API服务封装及业务系统集成;
3.统筹算法、后端、数据、前端等团队协作,保障项目按时高质量交付;
4.编写并审核技术方案、部署文档、接口说明、POC报告等项目交付资料;
5.深入客户实际应用场景,参与需求调研、方案讲解与技术答疑,提升客户认可度;
任职要求:
1.计算机、人工智能、软件工程等相关专业背景;
2.3年以上后端或AI项目开发经验,熟练掌握Python,具备大模型或分布式系统实践经验者优先;
3.掌握主流大模型架构及部署工具,如LLaMA/DeepSeek/Baichuan、vLLM、TGI、FastChat、Deepspeed、HuggingFaceTransformers等;
4.熟悉RAG检索增强生成、KVCache机制、推理优化、分布式训练/推理等核心技术;
5.具备项目交付经历,了解模型上线、效果评估、性能调优等落地环节者优先;
6.能够接受出差安排。
2026-06-26 12:20
IP属地:广东广州
职位福利
本科3-5年大模型ragpython

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










