职位详情
工作内容:
负责大模型(LLM)训练阶段的多语言数据质量检查,涵盖数据采集、清洗、去重、标注、格式转换及质量评估(包含自动化检测与抽样核查)
针对特定语言应用场景构建高效的数据处理流程与标准化机制,确保对应语种数据的质量达标
分析数据分布特征与覆盖范围,发现并修正数据偏差与漂移问题,提升训练数据的多样性、代表性和一致性
参与制定面向语种的质检规范,并对质检输出进行审核与持续优化
岗位要求:
需精通以下语言之一并具备母语或近母语能力:
印尼语
泰语
日/韩语
阿拉伯语
马来语
西班牙语
英语
葡萄牙语
越南语
能够在目标语言环境下设计提示语与评测语料,妥善处理语义歧义、术语统一性及文化语境差异
学历与背景:
语言学、计算机科学、上述小语种相关专业或相近领域本科及以上学历,具备跨学科背景者优先
具有1年以上数据处理或语言质量检验经验者优先,熟悉大模型训练数据处理流程者优先
负责大模型(LLM)训练阶段的多语言数据质量检查,涵盖数据采集、清洗、去重、标注、格式转换及质量评估(包含自动化检测与抽样核查)
针对特定语言应用场景构建高效的数据处理流程与标准化机制,确保对应语种数据的质量达标
分析数据分布特征与覆盖范围,发现并修正数据偏差与漂移问题,提升训练数据的多样性、代表性和一致性
参与制定面向语种的质检规范,并对质检输出进行审核与持续优化
岗位要求:
需精通以下语言之一并具备母语或近母语能力:
印尼语
泰语
日/韩语
阿拉伯语
马来语
西班牙语
英语
葡萄牙语
越南语
能够在目标语言环境下设计提示语与评测语料,妥善处理语义歧义、术语统一性及文化语境差异
学历与背景:
语言学、计算机科学、上述小语种相关专业或相近领域本科及以上学历,具备跨学科背景者优先
具有1年以上数据处理或语言质量检验经验者优先,熟悉大模型训练数据处理流程者优先
2026-03-14 08:51
IP属地:北京
职位福利
本科经验不限英语韩语/朝鲜语西班牙语印尼语日语法语新闻资讯

江苏成功企业管理有限公司苏州分公司

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










