职位详情
岗位职责:
1. 持续关注RAG与大模型领域的前沿动态(如多模态检索、增量更新机制、混合检索策略、GraphRAG等),深入研究先进检索算法、语义分块方法及生成效果优化路径,紧跟技术演进方向,推动技术创新与方案迭代;
2. 主导RAG技术体系的设计与实施,负责系统全周期建设工作,涵盖知识库搭建(非结构化数据清洗、结构化存储)、检索算法评估与选型(向量检索、语义匹配等)、生成环节优化(prompt设计、上下文整合),确保技术架构贴合企业实际业务需求;
3. 持续提升RAG系统性能表现,优化检索效率与生成准确率,针对业务反馈的检索偏差、回答异常等问题,快速定位根源(如知识库同步滞后、检索参数设置不当)并实施改进措施;
4. 为关键业务场景提供技术支撑,协助团队成员解决开发中的难点问题,能够依据模型上下文窗口限制(如4k/8k/32k)和token成本因素,制定合理的文本拆分与拼接策略;
5. 负责AI服务的交付与日常运营,具备强烈的责任意识,完成AI能力的定制化改造、接口对接及在业务系统中的落地部署,并持续提供运维支持保障。
任职要求:
1. 计算机科学与技术、软件工程、人工智能等相关专业本科及以上学历,具备2年以上RAG相关技术研发经历。
2. 技术基础扎实:熟练使用Python语言,精通NLP常用工具框架(如Hugging Face Transformers、LangChain、FAISS),具有向量数据库(如Milvus等)部署与性能调优实践经验。
3. 具备完整RAG系统落地能力,熟悉“数据预处理—知识库构建—检索策略设计—生成优化—测试上线—运维迭代”全流程,能独立应对召回率低、生成内容脱离上下文等典型问题;
4. 熟悉主流大模型(如QWEN/DEEPSEEK系列)特性,能根据具体业务需求选择适配的基础模型,具备大模型微调(LoRA、QLoRA)或上下文工程经验者优先;
5. 拥有RAG系统性能优化经验,可通过检索层调整(向量索引压缩、缓存机制设计)、生成层优化等手段,有效控制端到端响应延迟,满足实时性业务要求;
6. 具备在高压环境下快速识别问题并提出可行解决方案的能力。
1. 持续关注RAG与大模型领域的前沿动态(如多模态检索、增量更新机制、混合检索策略、GraphRAG等),深入研究先进检索算法、语义分块方法及生成效果优化路径,紧跟技术演进方向,推动技术创新与方案迭代;
2. 主导RAG技术体系的设计与实施,负责系统全周期建设工作,涵盖知识库搭建(非结构化数据清洗、结构化存储)、检索算法评估与选型(向量检索、语义匹配等)、生成环节优化(prompt设计、上下文整合),确保技术架构贴合企业实际业务需求;
3. 持续提升RAG系统性能表现,优化检索效率与生成准确率,针对业务反馈的检索偏差、回答异常等问题,快速定位根源(如知识库同步滞后、检索参数设置不当)并实施改进措施;
4. 为关键业务场景提供技术支撑,协助团队成员解决开发中的难点问题,能够依据模型上下文窗口限制(如4k/8k/32k)和token成本因素,制定合理的文本拆分与拼接策略;
5. 负责AI服务的交付与日常运营,具备强烈的责任意识,完成AI能力的定制化改造、接口对接及在业务系统中的落地部署,并持续提供运维支持保障。
任职要求:
1. 计算机科学与技术、软件工程、人工智能等相关专业本科及以上学历,具备2年以上RAG相关技术研发经历。
2. 技术基础扎实:熟练使用Python语言,精通NLP常用工具框架(如Hugging Face Transformers、LangChain、FAISS),具有向量数据库(如Milvus等)部署与性能调优实践经验。
3. 具备完整RAG系统落地能力,熟悉“数据预处理—知识库构建—检索策略设计—生成优化—测试上线—运维迭代”全流程,能独立应对召回率低、生成内容脱离上下文等典型问题;
4. 熟悉主流大模型(如QWEN/DEEPSEEK系列)特性,能根据具体业务需求选择适配的基础模型,具备大模型微调(LoRA、QLoRA)或上下文工程经验者优先;
5. 拥有RAG系统性能优化经验,可通过检索层调整(向量索引压缩、缓存机制设计)、生成层优化等手段,有效控制端到端响应延迟,满足实时性业务要求;
6. 具备在高压环境下快速识别问题并提出可行解决方案的能力。
2026-06-13 13:20
IP属地:广东广州
职位福利
本科3-5年深度学习大模型算法PythonJavaTransformerLANGCHAIN

安利(中国)日用品有限公司
已上市 · 10000人以上


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









