职位详情
工作内容:
1 离线与实时数据仓库建设:基于Flink、HiveSQL、PySpark等技术,开展离线和实时数据的清洗处理、缺失值填充、特征抽取与转换工作,打造高可用性的分析型数据集,为模型训练提供稳定可靠的数据支撑。
2 数据分析与业务理解:利用SQL、Python等工具对大规模数据进行探索性分析,识别数据中的隐藏规律与关联性,输出可视化图表与分析结论,支持业务策略制定与优化。
3 数据建模与挖掘应用:结合实际业务场景,采用机器学习与统计建模方法构建预测模型(如分类、聚类、回归等),应用于用户行为研究、风险评估、市场趋势预判等核心问题。
任职要求:
1 统计学、数学、计算机、数据科学等相关专业本科及以上学历,具备1年以上数据分析或数据挖掘相关工作经验
2 精通HiveSQL,掌握PySpark,可独立实现复杂查询逻辑、窗口函数及UDF开发,拥有海量数据处理实践经验
3 熟练使用Python及其常用库NumPy、Pandas、Scikit-learn,具备良好的统计学基础与机器学习理论素养
4 了解或愿意深入学习Flink技术,能够借助Flink实现流式数据处理与实时能力搭建
1 离线与实时数据仓库建设:基于Flink、HiveSQL、PySpark等技术,开展离线和实时数据的清洗处理、缺失值填充、特征抽取与转换工作,打造高可用性的分析型数据集,为模型训练提供稳定可靠的数据支撑。
2 数据分析与业务理解:利用SQL、Python等工具对大规模数据进行探索性分析,识别数据中的隐藏规律与关联性,输出可视化图表与分析结论,支持业务策略制定与优化。
3 数据建模与挖掘应用:结合实际业务场景,采用机器学习与统计建模方法构建预测模型(如分类、聚类、回归等),应用于用户行为研究、风险评估、市场趋势预判等核心问题。
任职要求:
1 统计学、数学、计算机、数据科学等相关专业本科及以上学历,具备1年以上数据分析或数据挖掘相关工作经验
2 精通HiveSQL,掌握PySpark,可独立实现复杂查询逻辑、窗口函数及UDF开发,拥有海量数据处理实践经验
3 熟练使用Python及其常用库NumPy、Pandas、Scikit-learn,具备良好的统计学基础与机器学习理论素养
4 了解或愿意深入学习Flink技术,能够借助Flink实现流式数据处理与实时能力搭建
2026-05-21 12:52
IP属地:广东深圳
职位福利
本科1-3年数据挖掘

深圳市腾娱互动科技有限公司
不需要融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
数据挖掘算法(研发负责人)
3-6万元/月
数据挖掘5-10年硕士大模型技术大数据处理经验深度学习Kafka自然语言处理Spark计算机相关专业Python数学/统计相关专业
深圳 南山区

黄女士 · szcentral5日内活跃






