职位详情
岗位职责(可远程工作)
1、聚焦大模型(LLM)与智能体(Agent)前沿方向,开展系统性技术研究与探索,涵盖指令微调(SFT)、函数调用(FunctionCall)、强化学习(RLHF/RLAIF)、多模态融合、长上下文建模等核心技术领域;
2、持续跟进大模型与智能体方向的最新学术论文与开源动态,高效完成关键成果复现与实验验证,输出研究报告、Benchmark评估结果及优化建议;
3、深入分析大小模型在垂直行业场景中的适配能力与落地潜力,开展模型性能对比、能力评测、压缩优化等研究工作,探索国产化环境下的适配方案与创新调优路径;
4、针对模型训练、推理与部署中的关键技术挑战(如高效并行策略、算子优化、数据调度等),提出可行的技术改进方案,并在实验环境中完成可行性验证;
5、积极参与研究成果的技术转化与知识共享,包括组织内部技术交流、撰写学术论文、申请专利及参与开源项目,助力团队在LLM与Agent领域保持技术领先。
任职要求
1、硕士及以上学历,计算机科学、人工智能、机器学习、数据科学等相关专业背景优先考虑;
2、具有大模型相关研究或实际项目经验,熟悉预训练、指令微调、强化学习、智能体构建等关键技术环节;
3、掌握Transformer架构及其核心机制(如自注意力、位置编码等),了解主流大模型优化技术(如GQA、MQA、FlashAttention等);
4、具备大模型训练实践经验,理解模型并行、数据并行、流水线并行等分布式训练方式,熟练使用至少一种主流训练框架(DeepSpeed、Megatron、Colossal-AI等),具备多机多卡配置经验者优先;
5、对大模型训练与评测所依赖的数据流程有深刻认知,熟悉数据构建、清洗、增强与标注方法,能针对数据质量与分布偏差提出研究级改进建议;
6、拥有扎实的机器学习与深度学习理论基础,熟练运用Pytorch、Huggingface等主流研究工具链;
7、具备突出的科研素养,包括问题建模、实验设计、结果解读与学术表达能力,有顶会论文发表或开源社区贡献经历者优先。
1、聚焦大模型(LLM)与智能体(Agent)前沿方向,开展系统性技术研究与探索,涵盖指令微调(SFT)、函数调用(FunctionCall)、强化学习(RLHF/RLAIF)、多模态融合、长上下文建模等核心技术领域;
2、持续跟进大模型与智能体方向的最新学术论文与开源动态,高效完成关键成果复现与实验验证,输出研究报告、Benchmark评估结果及优化建议;
3、深入分析大小模型在垂直行业场景中的适配能力与落地潜力,开展模型性能对比、能力评测、压缩优化等研究工作,探索国产化环境下的适配方案与创新调优路径;
4、针对模型训练、推理与部署中的关键技术挑战(如高效并行策略、算子优化、数据调度等),提出可行的技术改进方案,并在实验环境中完成可行性验证;
5、积极参与研究成果的技术转化与知识共享,包括组织内部技术交流、撰写学术论文、申请专利及参与开源项目,助力团队在LLM与Agent领域保持技术领先。
任职要求
1、硕士及以上学历,计算机科学、人工智能、机器学习、数据科学等相关专业背景优先考虑;
2、具有大模型相关研究或实际项目经验,熟悉预训练、指令微调、强化学习、智能体构建等关键技术环节;
3、掌握Transformer架构及其核心机制(如自注意力、位置编码等),了解主流大模型优化技术(如GQA、MQA、FlashAttention等);
4、具备大模型训练实践经验,理解模型并行、数据并行、流水线并行等分布式训练方式,熟练使用至少一种主流训练框架(DeepSpeed、Megatron、Colossal-AI等),具备多机多卡配置经验者优先;
5、对大模型训练与评测所依赖的数据流程有深刻认知,熟悉数据构建、清洗、增强与标注方法,能针对数据质量与分布偏差提出研究级改进建议;
6、拥有扎实的机器学习与深度学习理论基础,熟练运用Pytorch、Huggingface等主流研究工具链;
7、具备突出的科研素养,包括问题建模、实验设计、结果解读与学术表达能力,有顶会论文发表或开源社区贡献经历者优先。
2026-05-22 13:50
IP属地:北京
职位福利
硕士经验不限

北京星尘纪元智能科技有限公司
A轮 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












