职位详情
面向人工智能、科学计算与大数据处理融合的智能体系架构,
开展大规模预训练模型相关研究工作,涵盖数据清洗、算法设计、
训练推理优化、模型压缩等关键技术方向。
岗位职责:
1. 与团队成员协作推进模块设计与功能实现,完成系统性能调优;
攻克预训练模型研发中的核心算法难题,如模型评估、幻觉抑制等。
2. 持续探索前沿技术路径,推动方法创新,提升研发效率与协同开发水平。
任职要求:
1. 硕士及以上学历,计算机科学与技术专业优先,
计算机/人工智能/大数据知识工程/电子信息/通信等相关领域背景者亦可。
2. 具备良好的编码规范与文档编写能力,具备多人协作开发及代码评审经验,
对代码质量有严格标准,熟悉主流开发流程与git等工具,
掌握代码库构建与维护操作。
3. 扎实掌握深度学习基础理论,至少熟练使用一种主流框架,
如 PyTorch、TensorFlow、Paddle、MindSpore 等,
具备模型开发、部署与微调实际经验。
4. 对 Transformer 架构与深度学习有深入理解,
能基于论文复现算法,有大规模预训练模型训练经历者优先;
在 ACL、EMNLP、COLING、NAACL 等顶会发表过高质量论文者优先。
开展大规模预训练模型相关研究工作,涵盖数据清洗、算法设计、
训练推理优化、模型压缩等关键技术方向。
岗位职责:
1. 与团队成员协作推进模块设计与功能实现,完成系统性能调优;
攻克预训练模型研发中的核心算法难题,如模型评估、幻觉抑制等。
2. 持续探索前沿技术路径,推动方法创新,提升研发效率与协同开发水平。
任职要求:
1. 硕士及以上学历,计算机科学与技术专业优先,
计算机/人工智能/大数据知识工程/电子信息/通信等相关领域背景者亦可。
2. 具备良好的编码规范与文档编写能力,具备多人协作开发及代码评审经验,
对代码质量有严格标准,熟悉主流开发流程与git等工具,
掌握代码库构建与维护操作。
3. 扎实掌握深度学习基础理论,至少熟练使用一种主流框架,
如 PyTorch、TensorFlow、Paddle、MindSpore 等,
具备模型开发、部署与微调实际经验。
4. 对 Transformer 架构与深度学习有深入理解,
能基于论文复现算法,有大规模预训练模型训练经历者优先;
在 ACL、EMNLP、COLING、NAACL 等顶会发表过高质量论文者优先。
2026-06-25 13:48
IP属地:北京
职位福利
硕士3-5年深度学习大模型研发

北京远浪信息技术有限公司
不需要融资 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











