职位详情
- 基于现有视觉语言模型(如 Qwen-VL/InternVL/LLaVA/BLIP-2 等)进行终端侧的模型压缩、量化及知识蒸馏,实现模型部署闭环。
- 构建“自然语言指令 → 视觉目标/区域/属性”的映射解析机制,并设计安全控制策略(含黑名单过滤、敏感区域屏蔽等功能)。
- 实现 VLM 输出结果与下游任务流程(包括抓取、放置、质检等)的精准对齐,涵盖目标ID、位姿信息、置信度评分及时序一致性。
- 协同数据团队构建多模态数据集(包含图像、文本描述和操作行为标注),支持模型持续迭代与学习闭环。
- 对接 ROS2 及操控模块,集成多模态服务接口(基于 gRPC/ROS2 service/topic),确保系统低延迟响应与容错能力。
- 构建“自然语言指令 → 视觉目标/区域/属性”的映射解析机制,并设计安全控制策略(含黑名单过滤、敏感区域屏蔽等功能)。
- 实现 VLM 输出结果与下游任务流程(包括抓取、放置、质检等)的精准对齐,涵盖目标ID、位姿信息、置信度评分及时序一致性。
- 协同数据团队构建多模态数据集(包含图像、文本描述和操作行为标注),支持模型持续迭代与学习闭环。
- 对接 ROS2 及操控模块,集成多模态服务接口(基于 gRPC/ROS2 service/topic),确保系统低延迟响应与容错能力。
2026-07-01 14:10
IP属地:浙江杭州
职位福利
本科3-5年机器人图像算法深度学习大模型算法自然语言处理算法多模态算法算法工程化经验其他融合感知算法VLAC/C++机器学习VLM强化学习Python

润芯微科技(江苏)有限公司
B轮 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
视觉算法工程师
1.2-1.6万元/月
算法工程师1-3年硕士留学生优先国内院校优先图像算法自然语言处理算法C/C++Java嵌入式开发深度学习机器学习算法工程化经验团队管理经验
杭州 拱墅区 东新











