职位详情
岗位职责:
1、开展多模态大模型(VLM: Vision-Language Model / VLA: Vision-Language-Action Model)在人形机器人场景下的算法研发与系统实现,推动视觉-语言模型在机器人智能操作与自然人机交互中的应用;
2、参与大模型的预训练、指令微调(SFT)及强化学习优化(RL)全流程,并支持模型在复杂动态环境中的部署与性能提升;
3、协同机器人平台及硬件研发团队,完成算法在真实机器人系统中的集成与高效运行优化;
4、持续关注学术前沿进展,推进先进AI技术在实际产品中的转化与落地。
任职要求:
1、全日制硕士及以上学历,计算机、人工智能、自动化等相关专业背景,海外知名高校或国内重点院校优先考虑;
2、具备扎实的深度学习理论基础,掌握 Transformer、BERT、ViT、CLIP、BLIP 等主流视觉语言模型结构与原理;
3、具有大模型(VLM、LLM)训练或推理加速经验,了解其在多模态理解与生成任务中的典型应用场景;
4、具备 VLA 建模、生成式模型(如 diffusion)、多模态强化学习相关项目经历者优先;
5、熟练掌握 PyTorch、TensorFlow 等主流深度学习框架,具备较强的工程实现能力与代码素养;
6、具备良好的沟通协作意识,能够快速学习新技术并独立解决复杂问题。
加分项:
1、了解机器人感知、决策与控制基本流程,熟悉人形机器人在操作、导航、交互、动作预测等方面的任务体系;
2、有实际参与机器人系统或多模态人机交互系统开发的经验;
3、熟悉主流开源大模型项目(如 LLaVA, Pi0, RT-2, OpenVLA 等),并具备实际使用或优化改进经历。
1、开展多模态大模型(VLM: Vision-Language Model / VLA: Vision-Language-Action Model)在人形机器人场景下的算法研发与系统实现,推动视觉-语言模型在机器人智能操作与自然人机交互中的应用;
2、参与大模型的预训练、指令微调(SFT)及强化学习优化(RL)全流程,并支持模型在复杂动态环境中的部署与性能提升;
3、协同机器人平台及硬件研发团队,完成算法在真实机器人系统中的集成与高效运行优化;
4、持续关注学术前沿进展,推进先进AI技术在实际产品中的转化与落地。
任职要求:
1、全日制硕士及以上学历,计算机、人工智能、自动化等相关专业背景,海外知名高校或国内重点院校优先考虑;
2、具备扎实的深度学习理论基础,掌握 Transformer、BERT、ViT、CLIP、BLIP 等主流视觉语言模型结构与原理;
3、具有大模型(VLM、LLM)训练或推理加速经验,了解其在多模态理解与生成任务中的典型应用场景;
4、具备 VLA 建模、生成式模型(如 diffusion)、多模态强化学习相关项目经历者优先;
5、熟练掌握 PyTorch、TensorFlow 等主流深度学习框架,具备较强的工程实现能力与代码素养;
6、具备良好的沟通协作意识,能够快速学习新技术并独立解决复杂问题。
加分项:
1、了解机器人感知、决策与控制基本流程,熟悉人形机器人在操作、导航、交互、动作预测等方面的任务体系;
2、有实际参与机器人系统或多模态人机交互系统开发的经验;
3、熟悉主流开源大模型项目(如 LLaVA, Pi0, RT-2, OpenVLA 等),并具备实际使用或优化改进经历。
2026-06-29 14:47
IP属地:广东深圳
职位福利
硕士经验不限CNN/RNN/LSTM有国际期刊/会议论文发表业务导向/研究导向OpenCVTensorFlow/PyTorch机器学习算法/工程化经验Hadoop/Hive/Spark计算机相关专业

鹿明机器人科技(深圳)有限公司
天使轮 · 100-499人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >





