大模型开发研究

1.1-2.2万元/月

海淀区

张女士

已实名

企业认证

北京远浪信息技术有限公司

职位详情

大模型算法

面向人工智能、科学计算与大数据处理融合的智能体系架构，
开展大规模预训练模型相关研究工作，涵盖数据清洗、算法设计、
训练推理优化、模型压缩等关键技术方向。

岗位职责：
1. 与团队成员协作推进模块设计与功能实现，完成系统性能调优；
攻克预训练模型研发中的核心算法难题，如模型评估、幻觉抑制等。
2. 持续探索前沿技术路径，推动方法创新，提升研发效率与协同开发水平。

任职要求：
1. 硕士及以上学历，计算机科学与技术专业优先，
计算机/人工智能/大数据知识工程/电子信息/通信等相关领域背景者亦可。
2. 具备良好的编码规范与文档编写能力，具备多人协作开发及代码评审经验，
对代码质量有严格标准，熟悉主流开发流程与git等工具，
掌握代码库构建与维护操作。
3. 扎实掌握深度学习基础理论，至少熟练使用一种主流框架，
如 PyTorch、TensorFlow、Paddle、MindSpore 等，
具备模型开发、部署与微调实际经验。
4. 对 Transformer 架构与深度学习有深入理解，
能基于论文复现算法，有大规模预训练模型训练经历者优先；
在 ACL、EMNLP、COLING、NAACL 等顶会发表过高质量论文者优先。

2026-07-15 14:15

IP属地：北京

职位福利

硕士3-5年深度学习大模型研发