职位详情
岗位职责
1.数据特征算法:负责大规模代码数据的挖掘工作(如标签体系构建、结构化拼接、数据比例配置等),开展数据质量检测(包括低质内容识别、优质代码筛选等)以及数据合成相关算法研发;
2.数据pipeline建设:主导数据筛选、清洗、标注及质量评估流程的设计与实现。协同模型业务团队,深度挖掘数据价值,搭建自动化数据处理系统,支撑模型的持续优化与迭代;
3.数据实验分析:针对代码大模型训练所用数据进行系统性分析,建立规范化的实验评估机制,发现样本缺失、数据偏差、分布失衡等问题,推动数据质量、覆盖范围与多样性的全面提升,助力模型生成能力不断优化。
岗位要求
1.硕士及以上学历,计算机科学、自然语言处理等相关专业背景优先考虑;
2.熟悉主流深度学习框架(如PyTorch、TensorFlow),具备模型训练与数据处理实践经验,拥有出色的独立开发、问题分析与研究能力;
3.具备良好的沟通协作意识,自我驱动性强,能独立完成系统层面的分析与调优,推动大模型技术的实际落地应用;
4.可进行日常实习,每周至少全职投入4天,连续实习6个月以上者优先;27届毕业生优先考虑。
加分项
1.掌握HiveSQL、Spark、Ray中至少两项数据处理与分析工具;
2.对代码大模型有较深认知,具备敏锐的数据感知力和扎实的数据洞察分析能力;
3.有大模型训练或数据工程相关项目经验者优先。
1.数据特征算法:负责大规模代码数据的挖掘工作(如标签体系构建、结构化拼接、数据比例配置等),开展数据质量检测(包括低质内容识别、优质代码筛选等)以及数据合成相关算法研发;
2.数据pipeline建设:主导数据筛选、清洗、标注及质量评估流程的设计与实现。协同模型业务团队,深度挖掘数据价值,搭建自动化数据处理系统,支撑模型的持续优化与迭代;
3.数据实验分析:针对代码大模型训练所用数据进行系统性分析,建立规范化的实验评估机制,发现样本缺失、数据偏差、分布失衡等问题,推动数据质量、覆盖范围与多样性的全面提升,助力模型生成能力不断优化。
岗位要求
1.硕士及以上学历,计算机科学、自然语言处理等相关专业背景优先考虑;
2.熟悉主流深度学习框架(如PyTorch、TensorFlow),具备模型训练与数据处理实践经验,拥有出色的独立开发、问题分析与研究能力;
3.具备良好的沟通协作意识,自我驱动性强,能独立完成系统层面的分析与调优,推动大模型技术的实际落地应用;
4.可进行日常实习,每周至少全职投入4天,连续实习6个月以上者优先;27届毕业生优先考虑。
加分项
1.掌握HiveSQL、Spark、Ray中至少两项数据处理与分析工具;
2.对代码大模型有较深认知,具备敏锐的数据感知力和扎实的数据洞察分析能力;
3.有大模型训练或数据工程相关项目经验者优先。
2026-05-22 14:14
IP属地:广东深圳
职位福利
硕士经验不限发表算法相关优秀论文混元机器学习深度学习大模型算法自然语言处理算法大数据处理框架(Spark/Hadoop/Hive)参加算法相关竞赛/获奖日常实习生Python

腾讯科技(深圳)有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
算法工程师(人工智能 / 大规模模型)
9000-15000元/月
算法工程师经验不限本科深度学习机器学习图像算法ViTCLIPVGGNetK-means算法随机森林SVMTransformerDNNLSTM机器视觉自然语言处理知识图谱PyTorchTensorFlowOpenCVPythonC++C#
深圳 福田区

刘先生 · 湖南本格网络科技刚刚活跃
AI算法工程师(机器人/游戏方向)
1.5-3万元/月
算法工程师1-3年本科视觉图像算法机器人算法运动控制算法语音处理PyTorchTensorFlowMXNetOpenCVCNN
深圳 福田区

王先生 · 大象机器人今日活跃
AI工程师(算法与工程方向)
1.5-3万元/月
算法工程师经验不限本科深度学习机器学习图像算法ViTVGGNetGoogLeNetK-means算法SVMXGBoost机器视觉智能驾驶搜索/推荐算法PyTorchTensorFlowOpenCV接受26届不限经验带薪年假 节日福利大厂平台稳定
深圳 龙岗区
AI算法研发工程师
1-2万元/月
算法工程师3-5年本科深度学习机器视觉自然语言处理TensorFlowPyTorch工业机器人视觉检测办公智能体开发智能制造场景落地
深圳 龙华区

王先生 · 大简3日内活跃









