搜索
登录注册

职位详情

岗位职责:
1.VLA模型架构创新与研发:主导机器人视觉-语言-动作(VLA)大模型的结构设计、算法开发与工程实现,突破多模态特征高效对齐、动作序列生成及推理优化等核心技术瓶颈,显著增强模型在机器人操作、自动驾驶等复杂场景下的端到端任务执行性能;
2.机器人多模态智能系统构建:设计并落地融合视觉、语言与动作信号的联合训练体系,研发基于Transformer或扩散模型的跨模态交互机制,提升模型在动态环境中的语义感知、情境理解与自主决策水平;
3.模型高效部署与优化:针对具身智能硬件平台(如机械臂、移动机器人),深度优化VLA模型的实时推理效率,采用算子融合、量化压缩、模型剪枝等先进技术,实现模型在边缘设备上的高性能、低时延运行;
4.跨模态数据闭环体系搭建:搭建面向具身智能的大规模高质量数据采集、增强与标注流程,开发仿真验证工具链,构建数据驱动的模型迭代闭环,持续提升VLA模型在真实应用中的鲁棒性与泛化能力。

任职要求:
1、专业背景:计算机视觉、机器人学、自然语言处理等相关领域博士学历,研究方向集中于多模态大模型、具身智能或机器人决策控制。
2、技术能力:
(1)熟练掌握PyTorch/TensorFlow框架,具备VLA模型(如RT-2、OpenVLA、DiffusionPolicy)改进与部署经验,了解强化学习、模仿学习等相关方法;
(2)熟悉多模态对齐技术(CLIP、DINOv2等),拥有视觉语言模型(VLM)与动作生成模块联合调优实践;
(3)掌握机器人操作系统(ROS/ROS2),具备机器人感知-决策-控制全栈开发经验者优先。
3、经验要求:
(1)5年以上多模态算法研发经历,主导过VLA相关项目(如自动驾驶、机械臂操作等)并推动其商业化落地;
(2)在NeurIPS/ICML/CoRL等顶级会议发表过多篇VLA相关论文,或拥有具身智能领域的核心专利。
2026-06-18 13:29
IP属地:广东东莞

职位福利

硕士5-10年VLA具身智能大模型
企业发布信息图
维沃移动通信有限公司
不需要融资 · 500-999人
鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >
下载鱼泡直聘APP

附近适合您的职位

应用软件工程师-02-V8342J
2-3.5万元/月
GIS工程师3-5年本科管理规范服装补助弹性工作国际化管理通讯津贴
东莞
音频工程师/专家-S3581J
3.5-5.5万元/月
GIS工程师5-10年本科音频
东莞
GIS相关专业本科及以上学历
8000-13000元/月
GIS工程师3-5年本科
广州 越秀区 建设
gis高级软件开发工程师
1.4-2.5万元/月
GIS工程师5-10年本科WebGLArcGISJava团队管理经验地图/导航开发经验地理信息/测绘工程相关专业QGISMapGISPostGIS
深圳 福田区
高级GIS工程师
1.5-2.2万元/月
GIS工程师5-10年本科ArcGISJava团队管理经验QGISGeoSer
深圳 福田区
gis前端开发工程师
1.2-1.6万元/月
GIS工程师3-5年本科
深圳 南山区
数据工程师
150-200元/天
GIS工程师经验不限大专ArcGIS地理信息/测绘工程相关专业MapGISQGIS测绘内业数据处理经验
深圳
C++/地理信息系统开发工程师
1.4-2.2万元/月
GIS工程师3-5年本科C#ArcGISC++二维三维CQGISMapGIS图形开发WebGIS开发经验地图/导航开发经验3D图形PostGISC++客户端
深圳 南山区
WebGIS开发工程师
1.5-3万元/月
GIS工程师5-10年本科WebGLArcGISTaurinode.js地理信息/测绘工程相关专业PostGISElectronThree.jsCesiumWebGIS开发经验
深圳 南山区