职位详情
岗位职责:
1. 负责语义大模型相关数据的处理任务,涵盖数据采集、格式转换、过滤清洗、预处理、去重操作、定向内容提取及数据块构建等工作,保障数据的一致性与可用性。
2. 参与大模型性能评估工作,分析主流大模型基准测试数据集,提出提升数据质量的优化策略。
职位要求:
1. 本科及以上学历,计算机科学、软件工程、数学、统计学等相关专业背景。
2. 具备自然语言处理及语义大模型领域的基础理论知识。
3. 有1年以上大模型数据处理实际项目经验,熟悉数据清洗、网络爬虫、数据去重等关键技术环节。
4. 具备扎实的编程能力,精通Python语言,熟练运用Linux环境进行开发,掌握PyTorch或TensorFlow中至少一种主流框架。
5. 逻辑思维严密,注重细节,具备良好的沟通协作能力与高度的责任心。
1. 负责语义大模型相关数据的处理任务,涵盖数据采集、格式转换、过滤清洗、预处理、去重操作、定向内容提取及数据块构建等工作,保障数据的一致性与可用性。
2. 参与大模型性能评估工作,分析主流大模型基准测试数据集,提出提升数据质量的优化策略。
职位要求:
1. 本科及以上学历,计算机科学、软件工程、数学、统计学等相关专业背景。
2. 具备自然语言处理及语义大模型领域的基础理论知识。
3. 有1年以上大模型数据处理实际项目经验,熟悉数据清洗、网络爬虫、数据去重等关键技术环节。
4. 具备扎实的编程能力,精通Python语言,熟练运用Linux环境进行开发,掌握PyTorch或TensorFlow中至少一种主流框架。
5. 逻辑思维严密,注重细节,具备良好的沟通协作能力与高度的责任心。
2026-05-15 12:19
IP属地:北京
职位福利
本科1-3年爬虫计算机相关专业数据处理数据采集Python数据清洗

中电信人工智能科技(北京)有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









