职位详情
岗位职责
1. 大模型应用二次开发与参数优化:基于 LangChain / LlamaIndex / Dify / Haystack / RAGFlow / Flowise 等主流开源框架进行定制化开发及深度调参,实现个性化文档解析模块、向量索引策略配置、Agent 工具集成、Prompt 工程体系构建、重排序模型部署、权限控制扩展等功能。
2. 大模型推理引擎部署与性能优化:结合 pytorch、vllm、sglang 等开源推理框架,根据客户实际硬件环境调整推理参数,提升推理效率与资源利用率。
3. 私有化端到端部署与项目交付:基于 K8S 完成大模型应用的定制化部署,实现从开发到生产环境的全流程落地,确保系统在客户场景中的稳定运行。
4. 系统持续运维与迭代支持:承担上线后系统的版本迭代、问题排查与技术支持,输出运维文档、故障处理流程及培训资料,保障系统长期可用性。
任职要求
1. 计算机相关专业本科及以上学历,具备 2 年以上 AI 工程实施或私有化项目交付经验。
2. 熟练掌握以下至少两项开源框架,并有实际部署与二次开发案例:LangChain / LlamaIndex / Dify / Haystack / RAGFlow / FastGPT / Flowise
3. 熟悉至少一种主流大模型推理方案,如 hf原生 / vllm / sglang,理解其底层推理并行机制与优化逻辑。
4. 精通 Python 及 PyTorch 框架,具备扎实的工程实现能力;能够使用 C++/CUDA 或 Golang 开发高性能计算组件或辅助服务模块。
5. 掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法。
6. 具备强烈的技术探索精神,良好的表达能力和协作意识,能快速学习新技术并适应多变的工作环境;拥有出色的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。
1. 大模型应用二次开发与参数优化:基于 LangChain / LlamaIndex / Dify / Haystack / RAGFlow / Flowise 等主流开源框架进行定制化开发及深度调参,实现个性化文档解析模块、向量索引策略配置、Agent 工具集成、Prompt 工程体系构建、重排序模型部署、权限控制扩展等功能。
2. 大模型推理引擎部署与性能优化:结合 pytorch、vllm、sglang 等开源推理框架,根据客户实际硬件环境调整推理参数,提升推理效率与资源利用率。
3. 私有化端到端部署与项目交付:基于 K8S 完成大模型应用的定制化部署,实现从开发到生产环境的全流程落地,确保系统在客户场景中的稳定运行。
4. 系统持续运维与迭代支持:承担上线后系统的版本迭代、问题排查与技术支持,输出运维文档、故障处理流程及培训资料,保障系统长期可用性。
任职要求
1. 计算机相关专业本科及以上学历,具备 2 年以上 AI 工程实施或私有化项目交付经验。
2. 熟练掌握以下至少两项开源框架,并有实际部署与二次开发案例:LangChain / LlamaIndex / Dify / Haystack / RAGFlow / FastGPT / Flowise
3. 熟悉至少一种主流大模型推理方案,如 hf原生 / vllm / sglang,理解其底层推理并行机制与优化逻辑。
4. 精通 Python 及 PyTorch 框架,具备扎实的工程实现能力;能够使用 C++/CUDA 或 Golang 开发高性能计算组件或辅助服务模块。
5. 掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法。
6. 具备强烈的技术探索精神,良好的表达能力和协作意识,能快速学习新技术并适应多变的工作环境;拥有出色的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。
2026-05-16 12:27
IP属地:北京
职位福利
本科3-5年

中科聚信信息技术(北京)有限公司
B轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
大模型算法工程师/专家P6-7+
6-10万元/月
大模型算法3-5年本科自然语言处理PythonPyTorchMEGATRONVERLC++完整的大模型后训练实战经验
北京 海淀区

王女士 · 成都宸鑫华信息科技今日活跃







