职位详情
岗位职责:
1、根据大模型研发实际需要,构建音视频数据的长期采集体系。
2、主导数据清洗、重复数据剔除、格式标准化、隐私信息处理及风险内容分类,完成训练数据集的封装,并制定统一的数据接入规范。
3、不断拓展数据来源渠道,优化数据处理流程,提升预训练数据的覆盖范围与多样性,协同研发团队满足各类数据需求并解决相关技术问题。
4、关注人工智能前沿动态(如多模态技术、Agent架构、Harness Engineering等),探索新技术在复杂应用场景中的落地可能性。
岗位要求:
1、计算机、数据科学、电子信息或相关专业本科及以上学历,具备良好的沟通能力和团队合作意识;
2、具备2年以上工程研发背景,熟练使用Python、Golang等至少一种编程语言,优先考虑具备音视频处理经验者,Python能力尤为看重;
3、掌握Prompt设计方法,熟悉语音处理技术或了解NLP基础算法;
4、具备数据仓库操作能力(HSQL)及数据分析工具使用经验(如Pandas、Tableau)。
1、根据大模型研发实际需要,构建音视频数据的长期采集体系。
2、主导数据清洗、重复数据剔除、格式标准化、隐私信息处理及风险内容分类,完成训练数据集的封装,并制定统一的数据接入规范。
3、不断拓展数据来源渠道,优化数据处理流程,提升预训练数据的覆盖范围与多样性,协同研发团队满足各类数据需求并解决相关技术问题。
4、关注人工智能前沿动态(如多模态技术、Agent架构、Harness Engineering等),探索新技术在复杂应用场景中的落地可能性。
岗位要求:
1、计算机、数据科学、电子信息或相关专业本科及以上学历,具备良好的沟通能力和团队合作意识;
2、具备2年以上工程研发背景,熟练使用Python、Golang等至少一种编程语言,优先考虑具备音视频处理经验者,Python能力尤为看重;
3、掌握Prompt设计方法,熟悉语音处理技术或了解NLP基础算法;
4、具备数据仓库操作能力(HSQL)及数据分析工具使用经验(如Pandas、Tableau)。
2026-06-21 12:22
IP属地:北京
职位福利
本科1-3年ETL数据仓库PythonSqlKafka

中电金信软件有限公司
不需要融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >






