职位详情
岗位职责
1.大模型应用功能的二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源架构进行定制化开发及深度调参,实现个性化文档解析模块、向量索引设计、Agent工具集成、Prompt构建体系、结果重排序机制、权限控制逻辑等功能适配。
2.大模型推理引擎的部署与性能优化:结合pytorch、vllm、sglang等开源技术栈,根据客户实际硬件资源配置调整推理参数,实现高效率、低延迟的推理服务运行。
3.全流程私有化部署与项目交付:基于K8S完成大模型应用系统的定制化构建,并完成从环境准备到上线落地的端到端交付实施。
4.系统持续迭代与运维保障:承担系统上线后的版本更新、问题排查与技术支持工作,输出运维文档、故障处理流程、培训资料等配套材料。
任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.至少熟练掌握以下开源框架中的两项,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案,如hf原生/vllm/sglang,了解其所采用的推理并行化技术原理。
4.精通Python&PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略;
6.具备强烈的技术热情,良好的表达能力和协作意识,对前沿技术保持敏感度,能快速融入新场景;拥有较强的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。
1.大模型应用功能的二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源架构进行定制化开发及深度调参,实现个性化文档解析模块、向量索引设计、Agent工具集成、Prompt构建体系、结果重排序机制、权限控制逻辑等功能适配。
2.大模型推理引擎的部署与性能优化:结合pytorch、vllm、sglang等开源技术栈,根据客户实际硬件资源配置调整推理参数,实现高效率、低延迟的推理服务运行。
3.全流程私有化部署与项目交付:基于K8S完成大模型应用系统的定制化构建,并完成从环境准备到上线落地的端到端交付实施。
4.系统持续迭代与运维保障:承担系统上线后的版本更新、问题排查与技术支持工作,输出运维文档、故障处理流程、培训资料等配套材料。
任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.至少熟练掌握以下开源框架中的两项,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉至少一种主流大模型推理方案,如hf原生/vllm/sglang,了解其所采用的推理并行化技术原理。
4.精通Python&PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移策略;
6.具备强烈的技术热情,良好的表达能力和协作意识,对前沿技术保持敏感度,能快速融入新场景;拥有较强的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。
2026-06-14 12:40
IP属地:吉林长春
职位福利
本科1年以下

中科聚信信息技术(北京)有限公司
B轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
白城洮北区招弱电/安防,弱电大工1人,必须精通网络知识,设备接线调试,布线安装调试,年龄40岁以内
300-350元/天
维修门禁监控弱电工1-2人
白城 洮北区2026年06月17日 22:44

郭先生
今日活跃吉林长春用成手家装木工一人九个半小时350带1022码钉抢钢排抢水平仪
350元/天
家装木工1-4天1-2人日结
长春2026年06月17日 22:36

弓先生
今日活跃吉林长春南京工地招瓦工四名名,工作地点在江苏南京,市政的活,要长期的,短期的不要
7000-8000元/月
泥瓦工长期1-2人二把刀勿扰
长春 九台区2026年06月17日 22:31





