搜索
登录注册

职位详情

岗位职责
1.大模型应用的二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等主流开源框架进行定制化开发与深度调参,实现自定义文档解析模块、向量索引策略设计、Agent工具集成、Prompt工程体系构建、结果重排模型配置及权限控制扩展等功能。
2.大模型推理引擎部署与性能优化:结合客户实际硬件环境,利用pytorch、vllm、sglang等开源推理框架进行推理参数调优,提升推理效率与资源利用率。
3.私有化端到端部署与项目交付:基于K8S完成大模型应用的定制化部署,实现从环境搭建到生产上线的全流程交付,确保系统稳定运行于客户业务场景中。
4.系统持续迭代与运维保障:负责系统上线后的版本迭代、问题排查与技术支持,输出运维文档、故障处理流程及培训资料,保障系统长期可用性。

任职要求
1.计算机相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.熟练掌握以下至少两项开源框架,并具有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise。
3.至少熟悉一种主流大模型推理方案,如hf原生、vllm或sglang,理解其底层推理并行机制与优化路径。
4.精通Python及PyTorch框架,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能算子或配套Sidecar组件。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方案。
6.具备强烈的技术热情,良好的表达与协作能力,乐于探索新技术,能快速融入新环境;拥有出色的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。
2026-05-16 13:19
IP属地:北京

职位福利

本科1-3年RAGFlowLangChainPython & PyTorchDify / FlowiseMilvus大模型推理AgentPrompt 工程
企业发布信息图
中科聚信信息技术(北京)有限公司
B轮 · 100-499人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

微信-高级后台开发工程师-大模型训练架构
5-8万元/月
大模型算法3-5年硕士训练框架深度学习RLHFSOTA底层优化gCore
北京 海淀区
王女士 · 腾讯5日内活跃
大模型算法
1.5-2万元/月
大模型算法3-5年博士
北京 海淀区
AI实习生
200-250元/天
大模型算法经验不限本科DifyAIRAGLLMPython
北京 海淀区
大模型算法工程师(资深/高级)
3.5-6万元/月
大模型算法5-10年本科RAG/AgentNLP算法
北京 海淀区
大模型算法研发工程师
2-4万元/月
大模型算法3-5年硕士
北京 海淀区
AI大模型开发工程师+双休+五险一金
1.2-1.6万元/月
大模型算法1-3年本科图像算法智能驾驶大模型编程
北京 海淀区
大模型开发
1.5-1.7万元/月
大模型算法3-5年本科智能体Agent算法ai大模型dockerPython
北京 海淀区
大模型AI应用开发工程师(AE)
9000-14000元/月
大模型算法1-3年本科搜索/推荐算法AIAGENTAI大模型NLP
北京 海淀区
大模型Agent开发工程师
1.7-2.3万元/月
大模型算法3-5年本科
北京 海淀区
大模型算法工程师
4-7万元/月
大模型算法5-10年本科大模型
北京 海淀区