职位详情
岗位职责
1. 大模型应用功能二次开发与参数优化:依托 LangChain / LlamaIndex / Dify / Haystack / RAGFlow / Flowise 等开源平台进行定制化开发及深度参数配置,实现专属文档解析模块、向量索引机制、Agent 工具集成、Prompt 架构设计、结果重排序模型、权限控制逻辑等功能扩展。
2. 大模型推理引擎部署与效率优化:结合 pytorch、vllm、sglang 等开源技术栈,根据客户实际硬件环境调整推理参数,提升系统响应速度与资源利用率。
3. 全流程私有化部署与项目交付:基于 K8S 完成大模型应用的定制化封装,并实施端到端落地部署至客户现场环境。
4. 系统持续维护与技术支持:承担上线后系统的版本迭代、问题排查与应急响应等运维任务,输出运维文档、故障处理流程及培训资料。
任职要求
1. 计算机类相关专业本科及以上学历,具备 2 年以上 AI 工程实施或私有化项目交付经历。
2. 熟练掌握以下至少两类开源框架,并拥有实际部署与二次开发经验:LangChain / LlamaIndex / Dify / Haystack / RAGFlow / FastGPT / Flowise
3. 熟悉主流大模型推理方案中的一种或多种,如 hf原生 / vllm / sglang,了解其底层推理并行机制原理。
4. 精通 Python 与 PyTorch,具备扎实的工程实现能力;能够使用 C++/CUDA 或 Golang 开发高性能计算组件或辅助服务模块。
5. 掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略;
6. 具备强烈的技术热情,良好的表达与协作能力,对前沿技术保持关注,能快速融入新场景;拥有较强的逻辑分析、沟通协调、抗压调节与情绪管理能力。
1. 大模型应用功能二次开发与参数优化:依托 LangChain / LlamaIndex / Dify / Haystack / RAGFlow / Flowise 等开源平台进行定制化开发及深度参数配置,实现专属文档解析模块、向量索引机制、Agent 工具集成、Prompt 架构设计、结果重排序模型、权限控制逻辑等功能扩展。
2. 大模型推理引擎部署与效率优化:结合 pytorch、vllm、sglang 等开源技术栈,根据客户实际硬件环境调整推理参数,提升系统响应速度与资源利用率。
3. 全流程私有化部署与项目交付:基于 K8S 完成大模型应用的定制化封装,并实施端到端落地部署至客户现场环境。
4. 系统持续维护与技术支持:承担上线后系统的版本迭代、问题排查与应急响应等运维任务,输出运维文档、故障处理流程及培训资料。
任职要求
1. 计算机类相关专业本科及以上学历,具备 2 年以上 AI 工程实施或私有化项目交付经历。
2. 熟练掌握以下至少两类开源框架,并拥有实际部署与二次开发经验:LangChain / LlamaIndex / Dify / Haystack / RAGFlow / FastGPT / Flowise
3. 熟悉主流大模型推理方案中的一种或多种,如 hf原生 / vllm / sglang,了解其底层推理并行机制原理。
4. 精通 Python 与 PyTorch,具备扎实的工程实现能力;能够使用 C++/CUDA 或 Golang 开发高性能计算组件或辅助服务模块。
5. 掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略;
6. 具备强烈的技术热情,良好的表达与协作能力,对前沿技术保持关注,能快速融入新场景;拥有较强的逻辑分析、沟通协调、抗压调节与情绪管理能力。
2026-05-20 14:52
IP属地:上海
职位福利
本科3-5年

中科聚信信息技术(北京)有限公司
B轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









