职位详情
岗位职责:
1. 硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关专业亦可。
2. 具备良好的编程习惯与文档编写能力,具备多人协作开发及代码评审经验,对代码质量有较高要求;熟悉常用开发规范,熟练使用git等开发工具,掌握代码库的搭建与维护操作。
3. 掌握深度学习基础理论,至少熟练使用一种深度学习框架,如Paddle、Pytorch、Tensorflow、MindSpore等,具备模型开发、部署与微调的实际经验。
4. 对Transformer结构与深度学习有较深理解,能够根据论文复现算法;有大规模预训练模型研发与训练经历者优先;在ACL、EMNLP、COLING、NAACL等高水平会议发表过相关论文者优先。
任职要求:
1. 从事预训练模型相关研究工作,涵盖数据清洗、算法设计、训练推理、模型压缩等方向。
2. 与团队成员协作完成各类模块或功能的设计与实现,并开展性能优化;解决大规模预训练模型研发中的算法难题,如模型评估、缓解模型幻觉等问题。
3. 持续创新:主动探索新技术路径,不断提升个人工作效率及团队协同开发水平。
1. 硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关专业亦可。
2. 具备良好的编程习惯与文档编写能力,具备多人协作开发及代码评审经验,对代码质量有较高要求;熟悉常用开发规范,熟练使用git等开发工具,掌握代码库的搭建与维护操作。
3. 掌握深度学习基础理论,至少熟练使用一种深度学习框架,如Paddle、Pytorch、Tensorflow、MindSpore等,具备模型开发、部署与微调的实际经验。
4. 对Transformer结构与深度学习有较深理解,能够根据论文复现算法;有大规模预训练模型研发与训练经历者优先;在ACL、EMNLP、COLING、NAACL等高水平会议发表过相关论文者优先。
任职要求:
1. 从事预训练模型相关研究工作,涵盖数据清洗、算法设计、训练推理、模型压缩等方向。
2. 与团队成员协作完成各类模块或功能的设计与实现,并开展性能优化;解决大规模预训练模型研发中的算法难题,如模型评估、缓解模型幻觉等问题。
3. 持续创新:主动探索新技术路径,不断提升个人工作效率及团队协同开发水平。
2026-06-26 12:14
IP属地:北京
职位福利
硕士1-3年大模型

北京远浪信息技术有限公司
不需要融资 · 100-499人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
大模型应用研发工程师
1.5-3万元/月
大模型算法1-3年本科RAGFlowLangChainPython & PyTorchDify / FlowiseMilvus大模型推理AgentPrompt 工程
北京 海淀区








