职位详情
岗位职责:
1.参与大模型(LLM)训练算法的前沿研究与应用开发(如表格推理、表格生成代码、深度推理等),参与模型性能优化、开源项目及Agent类应用的研发工作
2.参与大模型的训练流程、模型调优与对比实验、数据集构建、原型系统实现以及大模型相关应用的开发
3.跟踪NLP领域最新学术进展,完成算法复现,并推动研究成果向工程落地转化,支持创新成果的输出与发表
任职要求:
1.硕士/博士在读,计算机、电子信息、人工智能等相关专业;
2.熟练掌握Python,具备扎实的编程实现能力,至少精通Pytorch或TensorFlow等主流深度学习框架之一,熟悉Linux使用环境;
3.实践能力强,能独立完成新模型的搭建和已有算法的复现,代码规范良好,熟练运用LoRA、QLoRA、P-Tuning、RLHF、llama_factory等微调技术;
4.具备一定RAG或Agent开发基础者优先,有论文发表经验者优先;
5.具备一定强化学习背景者优先,例如掌握DPO、PPO、GRPO等方法,且有实际项目经验或动手实践能力;
6.有参与开源项目经历者优先;
7.有大模型方向实习经验或竞赛经历者优先;
8.具备良好的科研素养与探索精神,乐于攻克技术难题,积极思考、主动推进、及时反馈;拥有强烈的好奇心与执行能力,对新技术保持敏感,对技术落地充满热情
1.参与大模型(LLM)训练算法的前沿研究与应用开发(如表格推理、表格生成代码、深度推理等),参与模型性能优化、开源项目及Agent类应用的研发工作
2.参与大模型的训练流程、模型调优与对比实验、数据集构建、原型系统实现以及大模型相关应用的开发
3.跟踪NLP领域最新学术进展,完成算法复现,并推动研究成果向工程落地转化,支持创新成果的输出与发表
任职要求:
1.硕士/博士在读,计算机、电子信息、人工智能等相关专业;
2.熟练掌握Python,具备扎实的编程实现能力,至少精通Pytorch或TensorFlow等主流深度学习框架之一,熟悉Linux使用环境;
3.实践能力强,能独立完成新模型的搭建和已有算法的复现,代码规范良好,熟练运用LoRA、QLoRA、P-Tuning、RLHF、llama_factory等微调技术;
4.具备一定RAG或Agent开发基础者优先,有论文发表经验者优先;
5.具备一定强化学习背景者优先,例如掌握DPO、PPO、GRPO等方法,且有实际项目经验或动手实践能力;
6.有参与开源项目经历者优先;
7.有大模型方向实习经验或竞赛经历者优先;
8.具备良好的科研素养与探索精神,乐于攻克技术难题,积极思考、主动推进、及时反馈;拥有强烈的好奇心与执行能力,对新技术保持敏感,对技术落地充满热情
2026-05-31 13:19
IP属地:北京
职位福利
硕士经验不限LoraLLM模型部署PythonRLHF

中电信人工智能科技(北京)有限公司
不需要融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >






