职位详情
岗位职责
1、负责 AI 相关业务方向的数据获取与数据生产体系构建,建立可靠高效的数据采集机制;
2、设计并实施 AI 训练数据的完整流程,涵盖数据采集、清洗、标注、增强及质量保障环节;
3、促进数据能力与 AI 模型训练、自动化应用场景深度融合,不断提升数据对业务的支撑效果;
4、持续跟踪爬虫技术、数据工程及 AI 数据生成领域的前沿进展,推动技术能力不断升级。
岗位要求
1、本科及以上学历,计算机科学、软件工程、数据工程、人工智能等相关专业优先考虑;
2、具备 3 年以上爬虫开发或数据工程实践经验,有大规模数据采集与处理项目经历;
3、熟练掌握 Python 爬虫开发,了解常见反爬机制及其应对方法(如动态渲染、验证码、风控策略等);
4、熟悉数据处理与 ETL 流程,具有数据清洗、去重、结构化转换及质量评估的实际能力;
5、了解至少一种数据标注或众包标注流程,掌握任务分解、质量抽查及标注标准制定;
6、具备较强的沟通协调能力和团队协作意识,能有效推进数据能力在实际业务中的应用落地。
1、负责 AI 相关业务方向的数据获取与数据生产体系构建,建立可靠高效的数据采集机制;
2、设计并实施 AI 训练数据的完整流程,涵盖数据采集、清洗、标注、增强及质量保障环节;
3、促进数据能力与 AI 模型训练、自动化应用场景深度融合,不断提升数据对业务的支撑效果;
4、持续跟踪爬虫技术、数据工程及 AI 数据生成领域的前沿进展,推动技术能力不断升级。
岗位要求
1、本科及以上学历,计算机科学、软件工程、数据工程、人工智能等相关专业优先考虑;
2、具备 3 年以上爬虫开发或数据工程实践经验,有大规模数据采集与处理项目经历;
3、熟练掌握 Python 爬虫开发,了解常见反爬机制及其应对方法(如动态渲染、验证码、风控策略等);
4、熟悉数据处理与 ETL 流程,具有数据清洗、去重、结构化转换及质量评估的实际能力;
5、了解至少一种数据标注或众包标注流程,掌握任务分解、质量抽查及标注标准制定;
6、具备较强的沟通协调能力和团队协作意识,能有效推进数据能力在实际业务中的应用落地。
2026-05-07 14:49
IP属地:广东广州
职位福利
本科3-5年Python反爬虫数据采集数据清洗数据挖掘社媒爬虫经验

德科信息有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











