职位详情
岗位职责:
作为核心算法成员,参与AI图像相关技术的研发工作,主要支撑新一代智能相册系统的建设。主要职责包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件归类、情绪判断、场景分类等任务;建立个性化的图像标签系统;
2)构建图像内容质量评估机制(如重复性、清晰度、人脸状态等),优化用户使用体验;
3)探索RAG架构与多模态大模型、文本大模型协同下的agent能力开发与实现路径。
二、图像AIGC方向(内容生成与编辑):
1)开展图像生成与编辑技术研究,包括背景更换、人像增强、风格转换、文本到图像、图像到图像等应用;
2)参与基于Diffusion架构的基础模型训练工作;
3)推进ControlNet、Inpainting、aigc编辑大模型等前沿模型在业务场景中的开发与落地。
任职要求:
一、基本条件:
1)计算机、人工智能、图像处理等相关专业硕士及以上学位;
2)具备扎实的深度学习理论基础,熟练使用PyTorch/TensorFlow等主流框架;
3)具有良好的编程能力,精通python和c++语言;
4)掌握图像分类、检测、分割、生成等典型任务及其常用网络结构;
5)能够独立完成算法设计、模型训练及上线优化全流程工作。
二、优先考虑:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)有移动端或端侧模型部署优化经验(如CoreML,ONNX,TensorRT等);
3)有实际产品化经验,例如智能图库、美颜功能、图像创作类工具等;
4)了解大模型(如GPT-4V,Gemini,Claude)在视觉任务中的融合应用。
作为核心算法成员,参与AI图像相关技术的研发工作,主要支撑新一代智能相册系统的建设。主要职责包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件归类、情绪判断、场景分类等任务;建立个性化的图像标签系统;
2)构建图像内容质量评估机制(如重复性、清晰度、人脸状态等),优化用户使用体验;
3)探索RAG架构与多模态大模型、文本大模型协同下的agent能力开发与实现路径。
二、图像AIGC方向(内容生成与编辑):
1)开展图像生成与编辑技术研究,包括背景更换、人像增强、风格转换、文本到图像、图像到图像等应用;
2)参与基于Diffusion架构的基础模型训练工作;
3)推进ControlNet、Inpainting、aigc编辑大模型等前沿模型在业务场景中的开发与落地。
任职要求:
一、基本条件:
1)计算机、人工智能、图像处理等相关专业硕士及以上学位;
2)具备扎实的深度学习理论基础,熟练使用PyTorch/TensorFlow等主流框架;
3)具有良好的编程能力,精通python和c++语言;
4)掌握图像分类、检测、分割、生成等典型任务及其常用网络结构;
5)能够独立完成算法设计、模型训练及上线优化全流程工作。
二、优先考虑:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)有移动端或端侧模型部署优化经验(如CoreML,ONNX,TensorRT等);
3)有实际产品化经验,例如智能图库、美颜功能、图像创作类工具等;
4)了解大模型(如GPT-4V,Gemini,Claude)在视觉任务中的融合应用。
2026-06-16 14:22
IP属地:广东深圳
职位福利
硕士10年以上多模态图像算法强化学习文生图

维沃移动通信有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >












