职位详情
线下面试
【岗位职责】
- 负责大模型相关算法的研究、优化与实际应用,深入理解主流大模型(如GPT系列、LLaMA、ChatGLM等)的核心机制,主导RLHF三阶段训练流程及LoRA等轻量化微调技术的改进与落地,持续提升模型性能与业务适配性。
- 主导大规模分布式训练体系构建,基于TensorFlow、PyTorch、Megatron、DeepSpeed等框架设计高效训练架构,突破训练过程中的性能瓶颈,保障训练稳定性和效率。
- 专注于NLP/NLU方向的算法研发,结合具体业务场景开展技术调研与创新探索,紧跟大数据模型、云原生架构等前沿趋势,推动先进技术在业务中的转化与价值实现。
- 统筹研发项目全流程管理,带领团队推进大模型相关任务执行,全面把控项目质量与进度,输出阶段性算法迭代成果,支撑模型持续演进。
- 与产品和工程团队密切配合,完成算法方案的集成实施与联合调优,攻克关键技术难题,具备良好沟通能力,促进跨部门协同高效运转。
- 持续关注技术发展动态,保持快速学习能力,适应新技术环境,结合行业变化和数字化需求,提出具有前瞻性的技术路径与解决方案。
【任职要求】
- 学历要求:计算机科学、人工智能或相关专业硕士及以上学历,博士优先,具备扎实的算法理论功底和科研能力。
- 工作经验:拥有2年以上大模型或人工智能领域研发经验,在大规模分布式训练、深度学习、NLP/NLU算法方面具备深厚积累和系统性架构经验。
- 专业技能:熟悉主流大模型(如GPT系列、LLaMA、ChatGLM等)的工作原理及其RLHF训练流程与LoRA微调技术;熟练使用TensorFlow、PyTorch、Megatron、DeepSpeed等工具,具备实际的大规模分布式训练实践经验;对大数据模型与云原生架构有深入理解和研究。
- 管理能力:具备较强的团队协作意识、沟通协调能力和项目统筹能力,能有效组织团队完成研发目标,对项目整体质量与进展具备把控力。
- 行业洞察能力:具备敏锐的业务感知力和技术前瞻性,能够结合数字化发展趋势,为产品和服务提供可持续的技术储备与创新方案。
- 其他要求:热爱技术,具备快速适应新环境与新技术的能力,拥有良好的应变能力和目标导向执行力。
【岗位职责】
- 负责大模型相关算法的研究、优化与实际应用,深入理解主流大模型(如GPT系列、LLaMA、ChatGLM等)的核心机制,主导RLHF三阶段训练流程及LoRA等轻量化微调技术的改进与落地,持续提升模型性能与业务适配性。
- 主导大规模分布式训练体系构建,基于TensorFlow、PyTorch、Megatron、DeepSpeed等框架设计高效训练架构,突破训练过程中的性能瓶颈,保障训练稳定性和效率。
- 专注于NLP/NLU方向的算法研发,结合具体业务场景开展技术调研与创新探索,紧跟大数据模型、云原生架构等前沿趋势,推动先进技术在业务中的转化与价值实现。
- 统筹研发项目全流程管理,带领团队推进大模型相关任务执行,全面把控项目质量与进度,输出阶段性算法迭代成果,支撑模型持续演进。
- 与产品和工程团队密切配合,完成算法方案的集成实施与联合调优,攻克关键技术难题,具备良好沟通能力,促进跨部门协同高效运转。
- 持续关注技术发展动态,保持快速学习能力,适应新技术环境,结合行业变化和数字化需求,提出具有前瞻性的技术路径与解决方案。
【任职要求】
- 学历要求:计算机科学、人工智能或相关专业硕士及以上学历,博士优先,具备扎实的算法理论功底和科研能力。
- 工作经验:拥有2年以上大模型或人工智能领域研发经验,在大规模分布式训练、深度学习、NLP/NLU算法方面具备深厚积累和系统性架构经验。
- 专业技能:熟悉主流大模型(如GPT系列、LLaMA、ChatGLM等)的工作原理及其RLHF训练流程与LoRA微调技术;熟练使用TensorFlow、PyTorch、Megatron、DeepSpeed等工具,具备实际的大规模分布式训练实践经验;对大数据模型与云原生架构有深入理解和研究。
- 管理能力:具备较强的团队协作意识、沟通协调能力和项目统筹能力,能有效组织团队完成研发目标,对项目整体质量与进展具备把控力。
- 行业洞察能力:具备敏锐的业务感知力和技术前瞻性,能够结合数字化发展趋势,为产品和服务提供可持续的技术储备与创新方案。
- 其他要求:热爱技术,具备快速适应新环境与新技术的能力,拥有良好的应变能力和目标导向执行力。
2026-05-21 13:07
IP属地:广东深圳
职位福利
博士经验不限

深圳市先创数字技术有限公司
不需要融资 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
算法研发工程师
1.4-2.2万元/月
算法工程师3-5年本科CV相关搜索算法图像算法深度学习大模型算法自然语言处理算法大数据处理框架(Spark/Hadoop/Hive)算法工程化经验推荐算法发表算法相关优秀论文C/C++参加算法相关竞赛
深圳 南山区

王女士 · 德科信息有限公司5日内活跃








