职位详情
岗位职责
1.针对大模型应用进行二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台开展定制化开发,深入调整框架参数,实现个性化文档解析模块、向量索引机制、Agent工具集成、Prompt构建体系、结果重排序模型、权限控制扩展等功能。
2.大模型推理引擎的部署与性能优化:结合pytorch、vllm、sglang等开源技术栈,根据客户实际硬件资源配置调整推理参数,确保系统运行效率最大化。
3.完成端到端私有化部署与项目交付:依托K8S平台完成大模型应用的定制化封装,并完整部署至客户业务环境,保障系统稳定上线。
4.负责系统后续迭代与运维支撑:承担上线后系统的功能更新、问题排查与技术支持,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握以下至少两项开源框架,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案,如hf原生/vllm/sglang,了解其底层推理并行化技术原理。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略。
6.具备强烈的技术热情,良好的表达与协作能力,乐于探索新技术,能快速融入新环境;拥有出色的逻辑分析能力、沟通技巧、抗压素质与情绪管理能力。
【base城市:北京or长春】
1.针对大模型应用进行二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台开展定制化开发,深入调整框架参数,实现个性化文档解析模块、向量索引机制、Agent工具集成、Prompt构建体系、结果重排序模型、权限控制扩展等功能。
2.大模型推理引擎的部署与性能优化:结合pytorch、vllm、sglang等开源技术栈,根据客户实际硬件资源配置调整推理参数,确保系统运行效率最大化。
3.完成端到端私有化部署与项目交付:依托K8S平台完成大模型应用的定制化封装,并完整部署至客户业务环境,保障系统稳定上线。
4.负责系统后续迭代与运维支撑:承担上线后系统的功能更新、问题排查与技术支持,输出运维文档、故障处理流程及培训资料。
任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握以下至少两项开源框架,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案,如hf原生/vllm/sglang,了解其底层推理并行化技术原理。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略。
6.具备强烈的技术热情,良好的表达与协作能力,乐于探索新技术,能快速融入新环境;拥有出色的逻辑分析能力、沟通技巧、抗压素质与情绪管理能力。
【base城市:北京or长春】
2026-06-09 14:35
IP属地:重庆
职位福利
本科经验不限

中科聚信信息技术(北京)有限公司
B轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
大模型应用开发工程师
1-2万元/月
大模型算法3-5年本科深度学习自然语言处理PyTorchTensorFlowPythonHR垂类大模型开发智能AGENT系统设计模型推理效率优化
重庆 南岸区







