职位详情
工作职责:
1.根据业务需求开展数据采集,通过公开网站及API接口进行数据抓取与解析,保障数据的完整性和时效性。
2.持续维护并优化现有基于Scrapy/requests/httpx/Selenium的爬虫程序。
3.进行数据库相关操作,使用Python对MySQL、MongoDB、Redis等常用存储系统完成建库建表、索引调优及数据清洗任务。
4.开发可复用的CRUD接口(基于FastAPI/Flask/DjangoRESTframework),支持内部系统的数据调用需求。
5.设计并维护日常运维脚本,实现定时备份、批量更新和异常告警等功能。
6.在Linux服务器上完成代码部署与任务调度(crontab/Airflow),监控爬虫运行状态,输出日志信息与可视化报表。
7.与算法、产品团队紧密协作,及时响应数据需求调整及线上问题处理。
8.编写技术文档(包括接口说明、部署手册、常见问题汇总),参与代码评审,遵守GitFlow与PEP8编码规范。
任职资格:
1.本科及以上学历,计算机、软件工程、信息管理等相关专业优先。
2.精通Python编程,掌握HTTP/HTTPS协议,熟练运用XPath、正则表达式、BeautifulSoup、PyQuery等解析工具。
3.熟悉MySQL的索引机制、事务处理及SQL性能优化;了解MongoDB、Redis的基本使用;具备RESTful接口开发经验(FastAPI/Flask/Django),可独立完成接口设计与文档编写。
4.掌握Linux常用命令,具备在服务器环境独立部署与调试服务的能力。
5.具备良好的沟通意识与责任心,关注数据准确性,能胜任重复性任务并高效处理突发情况。
6.有日均百万级数据采集与清洗项目经验者优先考虑。
7.熟悉消息队列(Kafka/RabbitMQ)、ElasticSearch、Docker、K8s技术者加分;具备算法基础(如NLP、机器学习)或对数据可视化工具(Grafana/PowerBI)有兴趣者亦受青睐。
你将获得
•来自一线互联网数据团队导师的一对一指导,深度参与大规模数据采集与数据仓库全流程实践。
•参与高并发、高性能场景的真实项目,积累简历亮点经历,并提供实习证明。
1.根据业务需求开展数据采集,通过公开网站及API接口进行数据抓取与解析,保障数据的完整性和时效性。
2.持续维护并优化现有基于Scrapy/requests/httpx/Selenium的爬虫程序。
3.进行数据库相关操作,使用Python对MySQL、MongoDB、Redis等常用存储系统完成建库建表、索引调优及数据清洗任务。
4.开发可复用的CRUD接口(基于FastAPI/Flask/DjangoRESTframework),支持内部系统的数据调用需求。
5.设计并维护日常运维脚本,实现定时备份、批量更新和异常告警等功能。
6.在Linux服务器上完成代码部署与任务调度(crontab/Airflow),监控爬虫运行状态,输出日志信息与可视化报表。
7.与算法、产品团队紧密协作,及时响应数据需求调整及线上问题处理。
8.编写技术文档(包括接口说明、部署手册、常见问题汇总),参与代码评审,遵守GitFlow与PEP8编码规范。
任职资格:
1.本科及以上学历,计算机、软件工程、信息管理等相关专业优先。
2.精通Python编程,掌握HTTP/HTTPS协议,熟练运用XPath、正则表达式、BeautifulSoup、PyQuery等解析工具。
3.熟悉MySQL的索引机制、事务处理及SQL性能优化;了解MongoDB、Redis的基本使用;具备RESTful接口开发经验(FastAPI/Flask/Django),可独立完成接口设计与文档编写。
4.掌握Linux常用命令,具备在服务器环境独立部署与调试服务的能力。
5.具备良好的沟通意识与责任心,关注数据准确性,能胜任重复性任务并高效处理突发情况。
6.有日均百万级数据采集与清洗项目经验者优先考虑。
7.熟悉消息队列(Kafka/RabbitMQ)、ElasticSearch、Docker、K8s技术者加分;具备算法基础(如NLP、机器学习)或对数据可视化工具(Grafana/PowerBI)有兴趣者亦受青睐。
你将获得
•来自一线互联网数据团队导师的一对一指导,深度参与大规模数据采集与数据仓库全流程实践。
•参与高并发、高性能场景的真实项目,积累简历亮点经历,并提供实习证明。
2026-06-28 13:06
IP属地:上海
职位福利
本科经验不限MySQL/Redis数据处理经验爬虫开发经验爬虫工程师Python

彩数(上海)商务咨询有限公司
不需要融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










