职位详情
一、岗位职责
1、开展 PDF 及多种格式文档的解析与信息抽取技术研究,针对扫描文件 OCR 识别、复杂版式文本提取等场景设计高效算法,持续提升解析精度与运行效率。
2、主导企业级知识库从零开始的构建与迭代工作,覆盖数据采集、清洗、存储到检索的完整链路,实现结构化与非结构化知识的一体化管理。
3、结合大语言模型与 RAG 技术打造智能检索与问答系统,融合传统关键词检索与向量语义检索策略,优化查询结果的相关性与响应性能。
4、负责知识库数据治理体系的技术实现,包括知识切片、质量评估、版本控制、敏感信息屏蔽等模块的算法研发与工程落地。
5、关注 NLP、大模型微调、文档理解等领域的最新进展,结合实际业务需求完成技术预研与实践应用,推动知识库系统的智能化演进。
6、与产品及业务团队紧密配合,将算法能力转化为可落地的产品功能,解决企业在知识组织与应用中的核心痛点。
二、任职要求
(一)核心必备要求
具备 2 年以上 PDF 文档解析实际项目经验,熟练运用 Apache Tika 等工具并能进行定制化开发,具备处理复杂格式与扫描件文本提取的技术能力。
拥有企业级知识库建设的全流程实践经验,深入掌握知识采集、预处理、存储与检索各环节的技术架构与实现逻辑,熟悉 Milvus 等向量数据库的集群部署与调优方案。
(三)技术能力要求
编程与算法基础:精通 Python 编程,有 C/C++ 开发经验者优先;具备扎实的数据结构与算法功底,掌握机器学习与深度学习的基本理论与方法。
模型与框架掌握:熟悉 PyTorch 或 TensorFlow 深度学习框架,了解 GPT、LLaMA、ChatGLM 等主流大模型的运行机制与典型应用场景。
大模型应用能力:掌握 LoRA、QLoRA 等参数高效微调技术,熟悉 Prompt Engineering 方法,在意图识别、语义匹配等 NLP 任务中有实际落地经验者优先。
工具链应用经验:熟练使用 LangChain、LlamaIndex 等大模型应用开发框架,掌握 Elasticsearch 等检索引擎的配置与性能优化技巧。
数据处理能力:具备大规模结构化与非结构化数据处理背景,熟悉数据清洗、语义分块、向量化表示等前置处理流程。
1、开展 PDF 及多种格式文档的解析与信息抽取技术研究,针对扫描文件 OCR 识别、复杂版式文本提取等场景设计高效算法,持续提升解析精度与运行效率。
2、主导企业级知识库从零开始的构建与迭代工作,覆盖数据采集、清洗、存储到检索的完整链路,实现结构化与非结构化知识的一体化管理。
3、结合大语言模型与 RAG 技术打造智能检索与问答系统,融合传统关键词检索与向量语义检索策略,优化查询结果的相关性与响应性能。
4、负责知识库数据治理体系的技术实现,包括知识切片、质量评估、版本控制、敏感信息屏蔽等模块的算法研发与工程落地。
5、关注 NLP、大模型微调、文档理解等领域的最新进展,结合实际业务需求完成技术预研与实践应用,推动知识库系统的智能化演进。
6、与产品及业务团队紧密配合,将算法能力转化为可落地的产品功能,解决企业在知识组织与应用中的核心痛点。
二、任职要求
(一)核心必备要求
具备 2 年以上 PDF 文档解析实际项目经验,熟练运用 Apache Tika 等工具并能进行定制化开发,具备处理复杂格式与扫描件文本提取的技术能力。
拥有企业级知识库建设的全流程实践经验,深入掌握知识采集、预处理、存储与检索各环节的技术架构与实现逻辑,熟悉 Milvus 等向量数据库的集群部署与调优方案。
(三)技术能力要求
编程与算法基础:精通 Python 编程,有 C/C++ 开发经验者优先;具备扎实的数据结构与算法功底,掌握机器学习与深度学习的基本理论与方法。
模型与框架掌握:熟悉 PyTorch 或 TensorFlow 深度学习框架,了解 GPT、LLaMA、ChatGLM 等主流大模型的运行机制与典型应用场景。
大模型应用能力:掌握 LoRA、QLoRA 等参数高效微调技术,熟悉 Prompt Engineering 方法,在意图识别、语义匹配等 NLP 任务中有实际落地经验者优先。
工具链应用经验:熟练使用 LangChain、LlamaIndex 等大模型应用开发框架,掌握 Elasticsearch 等检索引擎的配置与性能优化技巧。
数据处理能力:具备大规模结构化与非结构化数据处理背景,熟悉数据清洗、语义分块、向量化表示等前置处理流程。
2026-06-09 13:42
IP属地:四川成都
职位福利
大专经验不限JavaC/C++图像算法大模型算法自然语言处理算法Python

成都龙象科技股份有限公司
不需要融资 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
AI应用开发工程师
1.1-1.8万元/月
算法工程师5-10年本科语音算法Java机器学习图像算法深度学习大数据处理框架(Spark/Hadoop/Hive)Python
成都 武侯区

李女士 · 映潮科技今日活跃
AI算法工程师(雷达点云/人体姿态跌倒检测)
1.6-2.5万元/月
算法工程师经验不限本科雷达毫米波雷达边缘计算姿态识别SLAM算法Python深度学习机器学习大模型算法强化学习算法工程化经验发表算法相关优秀论文参加算法相关竞赛/获奖团队管理经验优秀开源项目经历
成都 武侯区









