职位详情
岗位职责
1. 后端开发:承担项目后端功能模块的设计、编码实现、单元测试及持续优化工作,确保系统运行稳定且具备良好性能。
2. 爬虫系统迭代:持续优化现有爬虫架构,拓展并维护目标网站的数据采集任务,改进解析规则、反爬策略与任务调度机制。
3. 采集监测与运维:每日跟踪各站点抓取情况,对频繁拦截或失败率异常的任务进行问题排查与策略调整,保障数据采集链路通畅。
4. 数据处理与入库:对采集数据执行初步去重和清洗操作,调用翻译与标签接口完成内容标准化;负责数据库维护,定期清除无效和冗余数据。
5. AI Agent 与模型集成:基于 Dify、Coze 等平台构建 Agent 工作流,对接大语言模型 API,结合业务需求优化应用逻辑、提示词设计及响应效率。
6. 架构与工具开发:参与后端技术选型、数据库结构设计和技术文档编写,承担内部工具及通用功能模块的开发任务。
任职要求
1. 计算机科学、软件工程、人工智能或相关专业本科及以上学历;掌握常见数据结构与算法,熟悉 Linux 开发环境。
2. 精通 Python 编程,具备脚本编写能力,熟练使用 Pandas、Numpy、regex 等库进行数据处理;至少掌握一种 Web 框架(如 Django、Flask)。
3. 熟悉至少一种关系型数据库(如 MySQL、PostgreSQL)的基本操作与性能调优;了解 AI Agent 概念及其开发实践。
4. 表达清晰、思维严谨,具有良好的团队协作意识,能积极推动项目落地,适应高强度工作节奏,富有耐心与责任感。
5. 加分项:具备实际 AI 项目(特别是大模型应用)开发经历;熟悉 RAG、模型微调等进阶技术;在编程竞赛中取得奖项者优先。
1. 后端开发:承担项目后端功能模块的设计、编码实现、单元测试及持续优化工作,确保系统运行稳定且具备良好性能。
2. 爬虫系统迭代:持续优化现有爬虫架构,拓展并维护目标网站的数据采集任务,改进解析规则、反爬策略与任务调度机制。
3. 采集监测与运维:每日跟踪各站点抓取情况,对频繁拦截或失败率异常的任务进行问题排查与策略调整,保障数据采集链路通畅。
4. 数据处理与入库:对采集数据执行初步去重和清洗操作,调用翻译与标签接口完成内容标准化;负责数据库维护,定期清除无效和冗余数据。
5. AI Agent 与模型集成:基于 Dify、Coze 等平台构建 Agent 工作流,对接大语言模型 API,结合业务需求优化应用逻辑、提示词设计及响应效率。
6. 架构与工具开发:参与后端技术选型、数据库结构设计和技术文档编写,承担内部工具及通用功能模块的开发任务。
任职要求
1. 计算机科学、软件工程、人工智能或相关专业本科及以上学历;掌握常见数据结构与算法,熟悉 Linux 开发环境。
2. 精通 Python 编程,具备脚本编写能力,熟练使用 Pandas、Numpy、regex 等库进行数据处理;至少掌握一种 Web 框架(如 Django、Flask)。
3. 熟悉至少一种关系型数据库(如 MySQL、PostgreSQL)的基本操作与性能调优;了解 AI Agent 概念及其开发实践。
4. 表达清晰、思维严谨,具有良好的团队协作意识,能积极推动项目落地,适应高强度工作节奏,富有耐心与责任感。
5. 加分项:具备实际 AI 项目(特别是大模型应用)开发经历;熟悉 RAG、模型微调等进阶技术;在编程竞赛中取得奖项者优先。
2026-05-26 08:05
IP属地:北京
职位福利
本科1-3年爬虫开发

北京双高志信人力资源有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










