职位详情
岗位职责:
1.负责搜推主场景(搜索/推荐/Feed)的样本数据平台建设,支持样本数据的采集、拼接、加工与存储。
2.负责离线训练样本的管理与特征回补,建设实时流式训练样本系统,支撑模型准实时训练与快速迭代。
3.搭建统一的离线+实时样本与特征链路,持续优化系统的稳定性、性能与可扩展性。
岗位要求:
1.本科及以上学历,计算机或相关专业,具备扎实的工程基础,熟练掌握Java/Python/Scala中至少一门。
2.熟悉大数据生态技术栈Spark、Flink、kafka、ClickHouse、hbase等大数据计算框架,具备离线ETL与实时计算实战经验
3.熟悉常见数据存储库(如MySQL/Doris/ClickHouse/HBase/Redis)
4.具备搜索、推荐等高并发场景的样本构建、特征抽取、样本拼接与存储经验,对数据稳定性和一致性有较强意识。
5.理解搜推系统与模型训练的数据链路,能够高效支撑算法侧的特征工程与样本需求。
6.具备良好的沟通协作能力,能与算法、业务团队高效配合,推进复杂系统持续演进。
加分项:
1.有推荐系统、内容分发、搜索系统、知识图谱等业务场景经验;
2.有AI平台、数据平台或模型工程化相关经验。
1.负责搜推主场景(搜索/推荐/Feed)的样本数据平台建设,支持样本数据的采集、拼接、加工与存储。
2.负责离线训练样本的管理与特征回补,建设实时流式训练样本系统,支撑模型准实时训练与快速迭代。
3.搭建统一的离线+实时样本与特征链路,持续优化系统的稳定性、性能与可扩展性。
岗位要求:
1.本科及以上学历,计算机或相关专业,具备扎实的工程基础,熟练掌握Java/Python/Scala中至少一门。
2.熟悉大数据生态技术栈Spark、Flink、kafka、ClickHouse、hbase等大数据计算框架,具备离线ETL与实时计算实战经验
3.熟悉常见数据存储库(如MySQL/Doris/ClickHouse/HBase/Redis)
4.具备搜索、推荐等高并发场景的样本构建、特征抽取、样本拼接与存储经验,对数据稳定性和一致性有较强意识。
5.理解搜推系统与模型训练的数据链路,能够高效支撑算法侧的特征工程与样本需求。
6.具备良好的沟通协作能力,能与算法、业务团队高效配合,推进复杂系统持续演进。
加分项:
1.有推荐系统、内容分发、搜索系统、知识图谱等业务场景经验;
2.有AI平台、数据平台或模型工程化相关经验。
2026-05-20 13:04
IP属地:江苏南京
职位福利
本科3-5年非外包类要求数据开发经验ETL开发经验实时数仓开发经验数据建模经验数据平台开发经验JavaPythonScalaSparkFlinkHBaseKafka

万声音乐科技(深圳)有限公司
C轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
数据开发
1.2-1.6万元/月
数据开发3-5年本科Hive要求数据开发经验PostgreSQLBI报表开发经验Spark计算机相关专业数据仓库开发经验OracleFlinkPython
南京 雨花台区

唐先生 · 睿服科技昨日活跃
大数据开发工程师
1.2-1.5万元/月
数据开发3-5年本科JavaHive要求数据开发经验ETL开发经验KafkaMySQL/SQL ServerSpark数据平台开发经验
南京 雨花台区

唐先生 · 睿服科技昨日活跃
数据开发(双休+国有企业)
1.1-1.3万元/月
数据开发1-3年本科Java要求数据开发经验ETL开发经验Kafka实时数仓开发经验数据平台开发经验Flink数据治理经验金融行业经验HiveBI报表开发经验Spark数据仓库开发经验
南京 雨花台区

唐先生 · 睿服科技昨日活跃




