数据采集实习生

180-200元/天

静安区

朱女士

已实名

企业认证

彩数(上海)商务咨询有限公司

职位详情

爬虫工程师

工作职责：
1.数据采集，按业务需求，对公开网站、API进行抓取与解析，确保数据完整性与及时性。
2.维护并优化现有Scrapy/requests/httpx/Selenium等爬虫脚本。
3.数据库操作，使用Python操作MySQL、MongoDB、Redis等常用存储，完成建库、建表、索引优化及数据清洗。
4.编写可复用的CRUD接口（FastAPI/Flask/DjangoRESTframework），供内部系统调用。
5.设计并维护日常运维脚本（定时备份、批量更新、异常告警）。
6.代码执行与维护，在Linux服务器上部署、调度（crontab/Airflow）并监控爬虫任务，输出运行日志与可视化报表。
7.与算法、产品同事协作，快速响应数据需求变更及线上故障。
8.撰写技术文档（接口说明、部署手册、常见问题FAQ），参与CodeReview，遵循GitFlow和PEP8规范。
任职资格：
1.本科及以上，计算机、软件工程、信息管理等相关专业。
2.熟练使用Python，理解HTTP/HTTPS、XPath、正则、BeautifulSoup、PyQuery等常用库。
3.熟悉MySQL索引、事务及SQL调优；了解MongoDB、Redis基础使用。具备RESTful接口开发经验（FastAPI/Flask/Django），能独立完成接口设计、文档输出。
4.了解Linux常用命令，能在服务器上独立部署与调试。
5.良好的沟通能力、责任心强，对数据质量敏感，能接受重复性工作与突发问题处理。
6.加分项，参与过日均百万级数据采集与清洗项目。
7.熟悉消息队列（Kafka/RabbitMQ）、ElasticSearch、Docker、K8s。有算法背景（NLP、机器学习）或对数据可视化（Grafana/PowerBI）感兴趣。

你将获得•一线互联网数据团队mentor1v1指导，深入理解大规模数据采集与数据仓库流程。高并发、高性能场景实践，简历亮点项目+实习证明。

2026-06-18 12:05

IP属地：上海

职位福利

本科经验不限python数据采集数据分析和处理爬虫接口开发