职位详情
岗位职责:
1. 设计、开发和维护高效稳定的网络爬虫系统,支持多平台、多协议数据采集
2. 对接反爬机制,实现动态渲染页面、验证码识别、登录态管理等复杂场景抓取
3. 清洗、解析、结构化海量非标数据,并完成与数据中台或业务系统的对接
4. 优化爬取策略与调度逻辑,提升采集效率、稳定性和资源利用率
5. 配合数据工程师完成数据质量监控、异常告警及日志分析工作
任职要求:
1. 本科及以上学历
2. 理解HTTP协议、HTML/CSS/JS基础、XPath/CSS Selector及常见反爬原理优先
3. 具备数据库操作能力(MySQL/PostgreSQL/MongoDB),了解基本ETL流程
4. 有分布式爬虫、代理池、任务调度(如Airflow)经验者优先
5. 遵守robots.txt及数据合规要求,具备良好的职业操守与法律意识
1. 设计、开发和维护高效稳定的网络爬虫系统,支持多平台、多协议数据采集
2. 对接反爬机制,实现动态渲染页面、验证码识别、登录态管理等复杂场景抓取
3. 清洗、解析、结构化海量非标数据,并完成与数据中台或业务系统的对接
4. 优化爬取策略与调度逻辑,提升采集效率、稳定性和资源利用率
5. 配合数据工程师完成数据质量监控、异常告警及日志分析工作
任职要求:
1. 本科及以上学历
2. 理解HTTP协议、HTML/CSS/JS基础、XPath/CSS Selector及常见反爬原理优先
3. 具备数据库操作能力(MySQL/PostgreSQL/MongoDB),了解基本ETL流程
4. 有分布式爬虫、代理池、任务调度(如Airflow)经验者优先
5. 遵守robots.txt及数据合规要求,具备良好的职业操守与法律意识
2026-05-24 19:08
IP属地:广东
职位福利
本科1-3年

六安文漫科技有限公司
20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












