职位详情
大模型算法工程师
【岗位职责】
1、负责大模型的架构设计、预训练、微调及持续迭代优化,提升模型在通用任务与垂直领域的整体性能表现。
2、参与指令微调、多模态对齐、RLHF、RAG、工具调用等核心算法的研究与工程实现,推动模型在对话理解、信息检索、推荐系统、内容生成等业务场景中的广泛应用。
3、搭建端到端的自然语言处理与多模态数据 pipeline,涵盖数据采集、清洗、去噪、指令构造、质量评估及合规性处理,构建高质量、可持续演进的训练与评测数据体系。
4、设计并开发高效的分布式训练与推理系统,探索模型并行、显存管理、量化压缩、动态批处理等关键技术,降低资源消耗与部署开销。
5、关注大语言模型、扩散模型、世界模型、智能体等前沿技术进展,协同产品、工程与设计团队,针对实际业务问题快速验证方案,建立可衡量的技术指标与效果评估机制,持续提升应用体验。
【任职要求】
必备条件
1、计算机科学、人工智能、数学、电子工程等相关专业硕士或以上学位。
2、具备2年以上自然语言处理算法研发经历,在预训练模型、多模态大模型、Transformer结构等方面有深入实践者优先。
3、熟练掌握 PyTorch / TensorFlow 至少一种主流深度学习框架,了解 DeepSpeed、vLLM 等分布式训练与推理加速工具。
4、具有扎实的算法基础和编程能力,熟悉 Linux 开发环境,能够独立完成复杂算法的设计、实现与生产部署。
5、熟悉主流大模型应用生态:能基于 Dify、Coze、LangChain、LlamaIndex 等框架快速构建 LLM 应用原型,并具备源码级定制开发能力以满足具体业务需求。
6、深刻理解 RAG 全链路流程,拥有 Agent 系统设计与落地经验,能够利用大模型构建可扩展的多智能体协作体系。
【岗位职责】
1、负责大模型的架构设计、预训练、微调及持续迭代优化,提升模型在通用任务与垂直领域的整体性能表现。
2、参与指令微调、多模态对齐、RLHF、RAG、工具调用等核心算法的研究与工程实现,推动模型在对话理解、信息检索、推荐系统、内容生成等业务场景中的广泛应用。
3、搭建端到端的自然语言处理与多模态数据 pipeline,涵盖数据采集、清洗、去噪、指令构造、质量评估及合规性处理,构建高质量、可持续演进的训练与评测数据体系。
4、设计并开发高效的分布式训练与推理系统,探索模型并行、显存管理、量化压缩、动态批处理等关键技术,降低资源消耗与部署开销。
5、关注大语言模型、扩散模型、世界模型、智能体等前沿技术进展,协同产品、工程与设计团队,针对实际业务问题快速验证方案,建立可衡量的技术指标与效果评估机制,持续提升应用体验。
【任职要求】
必备条件
1、计算机科学、人工智能、数学、电子工程等相关专业硕士或以上学位。
2、具备2年以上自然语言处理算法研发经历,在预训练模型、多模态大模型、Transformer结构等方面有深入实践者优先。
3、熟练掌握 PyTorch / TensorFlow 至少一种主流深度学习框架,了解 DeepSpeed、vLLM 等分布式训练与推理加速工具。
4、具有扎实的算法基础和编程能力,熟悉 Linux 开发环境,能够独立完成复杂算法的设计、实现与生产部署。
5、熟悉主流大模型应用生态:能基于 Dify、Coze、LangChain、LlamaIndex 等框架快速构建 LLM 应用原型,并具备源码级定制开发能力以满足具体业务需求。
6、深刻理解 RAG 全链路流程,拥有 Agent 系统设计与落地经验,能够利用大模型构建可扩展的多智能体协作体系。
2026-06-26 12:39
IP属地:山东青岛
职位福利
硕士1-3年

以萨技术股份有限公司
500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >








