职位详情
岗位职责
负责大模型(LLM)相关算法的探索与研究,承担模型结构设计、训练过程优化及高性能推理系统的开发工作。
深度参与大规模预训练或指令微调项目,攻克分布式训练中的内存占用、计算效率与训练收敛性难题。
实施模型压缩与加速策略(如量化、剪枝、知识蒸馏),推动优化后模型在生产环境中的部署与稳定运行。
设计并实现基于大模型的智能体(Agent)系统,支持多步任务分解、外部工具调用与自我迭代能力。
持续追踪大模型领域前沿技术,推进模型评估体系构建、对齐优化(如RLHF)以及多模型融合方案的实际落地。
任职要求
掌握深度学习核心理论,熟练运用Transformer架构、注意力机制及其改进结构。
熟悉大模型训练关键技术,包括分布式训练、混合精度训练、梯度检查点、数据/模型并行等方法。
了解主流大模型结构(如GPT、LLaMA、GLM、文心等),具有至少一种大规模模型预训练或微调的实际项目经验。
熟练使用至少一种主流训练框架(如DeepSpeed、Megatron-LM、Colossal-AI等)。
具备模型压缩与推理加速技术积累(如量化、剪枝、蒸馏),了解TensorRT、OpenVINO、ONNX Runtime等常用工具。
拥有高性能推理服务开发背景,熟悉vLLM、TGI、Triton Inference Server等推理引擎的应用与调优。
【优先考虑】
有智能体(Agent)系统搭建经验,了解LangChain、AutoGPT、ReAct等框架或方法论者优先。
具备CUDA编程与内核级优化能力,能针对模型底层计算进行定制化性能提升。
在顶级学术会议(NeurIPS、ICLR、ACL等)发表过相关研究成果,或曾参与开源大模型项目贡献者优先。
具备良好的跨团队协作意识与工程落地能力,能够独立完成从算法设计到线上部署的全流程开发任务。
负责大模型(LLM)相关算法的探索与研究,承担模型结构设计、训练过程优化及高性能推理系统的开发工作。
深度参与大规模预训练或指令微调项目,攻克分布式训练中的内存占用、计算效率与训练收敛性难题。
实施模型压缩与加速策略(如量化、剪枝、知识蒸馏),推动优化后模型在生产环境中的部署与稳定运行。
设计并实现基于大模型的智能体(Agent)系统,支持多步任务分解、外部工具调用与自我迭代能力。
持续追踪大模型领域前沿技术,推进模型评估体系构建、对齐优化(如RLHF)以及多模型融合方案的实际落地。
任职要求
掌握深度学习核心理论,熟练运用Transformer架构、注意力机制及其改进结构。
熟悉大模型训练关键技术,包括分布式训练、混合精度训练、梯度检查点、数据/模型并行等方法。
了解主流大模型结构(如GPT、LLaMA、GLM、文心等),具有至少一种大规模模型预训练或微调的实际项目经验。
熟练使用至少一种主流训练框架(如DeepSpeed、Megatron-LM、Colossal-AI等)。
具备模型压缩与推理加速技术积累(如量化、剪枝、蒸馏),了解TensorRT、OpenVINO、ONNX Runtime等常用工具。
拥有高性能推理服务开发背景,熟悉vLLM、TGI、Triton Inference Server等推理引擎的应用与调优。
【优先考虑】
有智能体(Agent)系统搭建经验,了解LangChain、AutoGPT、ReAct等框架或方法论者优先。
具备CUDA编程与内核级优化能力,能针对模型底层计算进行定制化性能提升。
在顶级学术会议(NeurIPS、ICLR、ACL等)发表过相关研究成果,或曾参与开源大模型项目贡献者优先。
具备良好的跨团队协作意识与工程落地能力,能够独立完成从算法设计到线上部署的全流程开发任务。
2026-05-20 13:13
IP属地:北京
职位福利
本科3-5年深度学习大模型算法

浩鲸云计算科技股份有限公司
未融资 · 10000人以上

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >









