搜索
登录注册

职位详情

岗位一:数据治理工程师

岗位职责:
1. 负责大模型训练与应用中多模态数据(文本、图像、代码、音视频等)从采集到归档的全周期管理,涵盖数据获取、清洗、去重、标注、结构化转换、质量检测及标准化建模工作;
2. 面向预训练、指令微调、强化学习等不同阶段的模型需求,构建高质、多元的数据集,设计并执行数据筛选机制与质量评分标准,持续提升数据对模型效果的支撑能力;
3. 制定和优化数据治理规范与操作流程,推进数据标准制定、元数据维护、数据血缘追踪等能力建设,增强数据可追溯性与复用水平;
4. 搭建自动化数据处理流水线,结合机器学习与大语言模型技术实现低质内容识别、敏感信息屏蔽、语义重复判断、噪声剔除等功能;
5. 与算法团队协作开展数据分布分析与偏差排查,定位数据偏移、标签错误、采样失衡等问题,并提出针对性优化策略;
6. 遵循数据安全与隐私合规要求,实施数据脱敏、匿名处理、权限管控等措施,保障数据在采集与使用过程中的合法合规性;
7. 联动产品、算法、开发等多方团队,推动数据治理体系在实际业务场景中的有效落地;
8. 完成上级安排的其他相关任务。

任职要求:
1. 本科及以上学历,计算机科学、大数据技术、人工智能或相关专业背景,具备扎实的数据处理理论功底;
2. 精通Python、SQL等编程语言,具备良好编码习惯,熟练使用Pandas、NumPy等主流数据处理工具,能够高效处理非结构化与半结构化数据类型;
3. 熟悉常见文件格式及数据存储系统;
4. 掌握NLP基础技术(如分词、命名实体识别、文本分类、相似度计算)和CV基本处理流程(如图像去噪、关键帧提取、目标检测标注),具有大模型预训练语料构建经验者优先;
5. 具备敏锐的数据洞察力与逻辑分析能力,能从大规模复杂数据中识别质量问题(如冗余、偏见、噪声、不一致)并设计可行解决方案;
6. 熟悉数据质量评估维度(完整性、准确性、一致性、时效性、唯一性)及相关治理方法论者优先;
7. 了解数据安全与隐私保护机制,掌握常见脱敏技术;
8. 具备良好的沟通协调能力和团队合作意识,能够跨职能推动数据规范实施,具备技术文档编写与汇报能力;
9. 有在AI企业、大型互联网公司或数据服务类机构从事数据治理、数据中台建设经验者优先。
2026-05-25 12:35
IP属地:四川成都

职位福利

本科3-5年
企业发布信息图
福建国科信息科技有限公司
B轮 · 1000-9999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

数据治理
1.3-1.4万元/月
数据治理5-10年本科DCMM保险数仓
成都 武侯区
舆情监测专员
4000-6000元/月
数据治理1-3年本科
成都 武侯区
高级数据管理工程师
1-1.5万元/月
数据治理5-10年本科dama主数据
成都 武侯区
数据治理咨询师
9000-13000元/月
数据治理5-10年本科
成都 武侯区
数据治理主管
1.5-2万元/月
数据治理5-10年本科
成都 武侯区
(千禾-上市公司)数据治理工程师(产品及组织方向)
8000-15000元/月
数据治理3-5年本科SQLiteAccessHBaseMySQLSQLAxureTO C主数据治理
成都 武侯区
数据治理工程师
1.4-1.5万元/月
数据治理3-5年本科数据库开发数据仓库
成都 武侯区
(千禾-上市公司)数据治理工程师(通路及客群领域)
8000-15000元/月
数据治理1-3年本科MySQLSQLTO CSQL/PYTHON主数据治理
成都 武侯区
数据治理岗
6000-14000元/月
数据治理3-5年本科
成都 武侯区