搜索
登录注册

职位详情

岗位福利:
工作时间7.5小时;8:30-9:00弹性打卡,9点打卡则18:30后下班;周末双休(基本无加班需求)
福利待遇: 固定底薪+年终奖 (食堂采用自助餐形式包中餐、社保公积金按薪资全额缴纳、公积金比例各6%;年终奖2-3个月、停车免费、通讯补贴150-200元,享受其他事业单位相关福利)

岗位职责:
1、规划并落地高可用的数据采集架构,从多元化的公开与私有来源(如网页、代码库、学术论文、书籍等)中合规获取大规模多模态数据;
2、设计并持续优化自动化数据处理流程,结合规则引擎、启发式策略及机器学习技术(如嵌入、聚类、分类模型)实现数据去重、毒性内容过滤、质量分级与信息归类;
3、构建并维护支持PB级数据存储、计算与分析的高性能分布式平台及流水线系统(基于Spark、Flink等框架),保障系统的稳定性与扩展性;
4、建立完善的数据质量评估机制,融合自动化监控与人工审核手段,推动数据集质量的持续优化,并协同算法团队分析数据对模型表现的影响;
5、与科研人员、算法工程师高效协作,深度理解模型训练需求,探索创新性的数据处理方案与技术路径,助力模型能力突破。

任职要求:
1、统招本科及以上学历,计算机相关专业,具备3年以上开发经验,了解合法合规的数据采集方式,掌握数据清洗、过滤与提质的相关算法和流程,有大数据或大模型项目经验者优先;
2、熟练使用java、scala或python等编程语言,具有spark/hadoop平台开发背景,熟悉大规模分布式数据处理体系架构;
3、精通网络协议原理,掌握正则表达式应用,了解数据挖掘与搜索引擎核心技术,具备爬虫开发及网页内容解析的实际经验;
4、保持对前沿技术的敏锐度,同时具备良好的沟通协调能力、自主学习能力和问题分析解决能力。
2026-05-17 13:41
IP属地:广东广州

职位福利

本科3-5年Java要求数据开发经验Scala制造业行业经验大模型Spark数据平台开发经验FlinkPython
企业发布信息图
深圳易宝软件有限公司
未融资 · 1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

大数据开发工程师(26届校园招聘)
1-1.5万元/月
数据开发经验不限硕士Java要求数据开发经验ScalaETL开发经验数据建模经验Kafka实时数仓开发经验非外包类数据平台开发经验Flink数据治理经验C/C++其他数据开发经验BI报表开发经验
广州 黄埔区
数据开发工程师
1.1-1.8万元/月
数据开发3-5年本科Shell要求数据开发经验ETL开发经验KafkaMySQL/SQL ServerBI报表开发经验非外包类Spark数据平台开发经验OraclePythonSQL
广州 黄埔区
朱女士 · 君南5日内活跃
高级大数据开发工程师
1.3-1.7万元/月
数据开发5-10年大专Java要求数据开发经验ETL开发经验其他数据开发经验MySQL/SQL ServerBI报表开发经验实时数仓开发经验其他数据平台开发经验数据仓库开发经验数据治理经验Python
广州 黄埔区
中级大数据开发工程师
1-1.3万元/月
数据开发3-5年大专Java要求数据开发经验ETL开发经验其他数据开发经验MySQL/SQL Server实时数仓开发经验其他数据平台开发经验数据仓库开发经验Python
广州 黄埔区
自动驾驶数据工程师 全国招聘(J1004)
1.8-2.5万元/月
数据开发经验不限硕士C/C++自动驾驶要求数据开发经验非外包类其他数据平台开发经验数据采集PythonSQL
广州 黄埔区
初级大数据开发工程师
1.1-1.4万元/月
数据开发3-5年大专Java要求数据开发经验ScalaETL开发经验MySQL/SQL Server实时数仓开发经验数据平台开发经验Flink数据治理经验ShellHivePrestoBI报表开发
广州 黄埔区
大数据开发
1-1.4万元/月
数据开发3-5年大专Java要求数据开发经验实时数仓开发经验其他Spark数据平台开发经验数据仓库开发经验
广州 黄埔区
大数据开发工程师(PYTHON方向)
8000-9000元/月
数据开发1-3年本科ETL开发经验Python
广州 黄埔区
初级数据开发工程师(需到岗惠州项目现场)
5000-10000元/月
数据开发1-3年大专要求数据开发经验ETL开发经验Kafka非外包类其他数据平台开发经验数据仓库开发经验Flink
广州 黄埔区
朱女士 · 君南5日内活跃
数据开发
8000-12000元/月
数据开发经验不限本科要求数据开发经验PostgreSQLClickhouse非外包类数据平台开发经验金融行业经验Python
广州 黄埔区