搜索
登录注册

职位详情

岗位职责
1. 大模型应用方向的二次开发与参数优化:依托 LangChain / LlamaIndex / Dify / Haystack / RAGFlow / Flowise 等开源架构进行定制化开发及深度调参,实现个性化文档解析模块、向量索引机制、Agent 工具集成、Prompt 工程体系构建、重排序模型配置、权限控制扩展等功能。
2. 大模型推理引擎的部署与效能优化:结合 pytorch、vllm、sglang 等开源技术栈,根据客户实际硬件环境调整推理参数,实现推理效率与资源利用的最优化。
3. 私有化场景下的端到端部署与交付:基于 K8S 完成大模型应用系统的定制化封装,并完成在客户现场的全流程部署与交付落地。
4. 系统持续迭代与运维保障:承担上线后系统的版本更新、问题响应与稳定性维护工作,输出运维文档、故障处理流程及培训资料。

任职要求
1. 计算机类相关专业本科及以上学历,具备 2 年以上 AI 工程实施或私有化项目交付经验。
2. 熟练掌握以下至少两项开源框架,并拥有实际部署与二次开发经历:LangChain / LlamaIndex / Dify / Haystack / RAGFlow / FastGPT / Flowise
3. 熟悉主流大模型推理方案中的至少一种,如 hf原生 / vllm / sglang,了解其底层推理并行化实现原理。
4. 精通 Python 与 PyTorch,具备扎实的工程实现能力;能够使用 C++/CUDA 或 Golang 开发高性能计算组件或辅助服务模块。
5. 掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略;
6. 具备强烈的技术探索意愿,良好的表达与协作能力,对前沿技术保持敏感度,能快速融入新场景;拥有出色的逻辑分析能力、沟通协调能力、抗压性与情绪管理能力。
2026-05-20 12:13
IP属地:北京

职位福利

本科1-3年RAGFlowLangChainPython & PyTorchDify / FlowiseMilvus大模型推理AgentPrompt 工程
企业发布信息图
中科聚信信息技术(北京)有限公司
B轮 · 100-499人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

AI Agent开发⼯程师
3-6万元/月
大模型算法5-10年本科
北京 海淀区
AI⼤模型算法专家
4.5-5万元/月
大模型算法5-10年硕士
北京 海淀区
大语言模型研发
1.6-2万元/月
大模型算法3-5年本科自然语言处理Python
北京 海淀区
大模型算法高级
7-10万元/月
大模型算法5-10年硕士
北京 海淀区
大模型算法工程师
7-10万元/月
大模型算法5-10年本科rag
北京 海淀区
大模型算法研发工程师
5-8万元/月
大模型算法3-5年硕士
北京 海淀区
王女士 · 腾讯5日内活跃
大模型应用算法组长(军工)
4-5万元/月
大模型算法5-10年硕士sft/dpo/grpo军工大模型后训自动化评测基线智能体(Agent)研发
北京 海淀区
智能体开发工程师(大唐软件项目外包)
1.8-2万元/月
大模型算法5-10年本科
北京 海淀区
大模型应用开发工程师(需长期外派)
1.5-3万元/月
大模型算法经验不限本科计算机相关专业
北京 海淀区
技术岗(大模型领域)
1.7-2.3万元/月
大模型算法1-3年硕士大模型
北京 海淀区
申先生 · 远浪5日内活跃