职位详情
岗位职责:
1.负责搭建大模型训练与测试所需的数据集,开发数据处理算法,实现数据建设的全流程闭环;
2.开展原始数据的预处理、清洗及增强等算法研发,打造高质量行业数据集,涵盖文本、代码及多模态数据类型;
3.承担大模型测评相关工作,包括评测指标设计、测试用例规划、测试数据维护及测试工具研发;
4.参与数据安全体系建设,涉及数据合规审核、隐私信息加密保护、数据漏洞检测等相关任务;
任职要求:
1.计算机、自然语言处理、数学等相关专业背景,具有3年以上大模型数据构建领域工作经验;
2.熟悉文本、图像、视频等多类型数据的采集、清洗、过滤与增强流程,具备数据处理Pipeline搭建及算子开发能力;
3.精通Python编程,熟练使用大模型相关技术工具;
4.掌握大数据ETL流程及数据库基础知识;
1.负责搭建大模型训练与测试所需的数据集,开发数据处理算法,实现数据建设的全流程闭环;
2.开展原始数据的预处理、清洗及增强等算法研发,打造高质量行业数据集,涵盖文本、代码及多模态数据类型;
3.承担大模型测评相关工作,包括评测指标设计、测试用例规划、测试数据维护及测试工具研发;
4.参与数据安全体系建设,涉及数据合规审核、隐私信息加密保护、数据漏洞检测等相关任务;
任职要求:
1.计算机、自然语言处理、数学等相关专业背景,具有3年以上大模型数据构建领域工作经验;
2.熟悉文本、图像、视频等多类型数据的采集、清洗、过滤与增强流程,具备数据处理Pipeline搭建及算子开发能力;
3.精通Python编程,熟练使用大模型相关技术工具;
4.掌握大数据ETL流程及数据库基础知识;
2026-05-17 14:19
IP属地:江苏南京
职位福利
硕士经验不限要求数据开发经验ETL开发经验数据建模经验其他数据开发经验非外包类数据治理经验Python

苏州汇川技术有限公司
已上市 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
大数据开发工程师(长期岗位)
1-1.3万元/月
数据开发3-5年大专JavaHive要求数据开发经验ETL开发经验k8sKafka非外包类Spark数据平台开发经验docker
南京 建邺区

商女士 · 睿纳博信息科技5日内活跃
数据开发(双休+国有企业)
1.1-1.3万元/月
数据开发1-3年本科Java要求数据开发经验ETL开发经验Kafka实时数仓开发经验数据平台开发经验Flink数据治理经验金融行业经验HiveBI报表开发经验Spark数据仓库开发经验
南京 雨花台区

唐先生 · 睿服科技5日内活跃
大数据开发工程师
1.1-1.4万元/月
数据开发3-5年本科Java数据湖ERP要求数据开发经验电商/零售行业经验StarRocksSpark数据平台开发经验TB级别数据Flink
南京 江宁区

杨女士 · 上海佩航能源5日内活跃







