职位详情
岗位职责:
作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件聚类、情绪识别、场景识别等任务;构建个性化的图像语义标签体系;
2)设计图像内容质量评估模型(如重复、模糊、人脸表情等),优化用户使用体验;
3)探索RAG、多模态图像大模型与文本大模型协同机制,推进agent能力的研发与实现。
二、图像AIGC方向(创作与编辑):
1)研究并落地图像生成与编辑类算法,包括背景替换、人像美化、风格迁移、文生图、图生图等应用;
2)参与基于Diffusion架构的基础模型训练工作;
3)参与ControlNet、Inpainting、aigc编辑大模型等前沿模型在业务场景中的开发与应用。
任职要求:
一、基础能力:
1)计算机、人工智能、图像处理等相关专业硕士及以上学历;
2)具备扎实的深度学习理论基础,熟练掌握PyTorch / TensorFlow等主流框架;
3)具备良好的编程能力,精通python和c++语言;
4)熟悉图像识别、检测、分割、生成等常见任务及其典型网络结构;
5)能够独立完成从算法设计、模型训练到上线调优的全流程工作。
二、加分项:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)具备模型端侧部署优化经验(如CoreML, ONNX, TensorRT等);
3)有实际产品落地经历,例如智能相册、人像美颜、图像创作类工具等;
4)了解大模型(如GPT-4V, Gemini, Claude)与视觉任务融合的应用方式。
作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件聚类、情绪识别、场景识别等任务;构建个性化的图像语义标签体系;
2)设计图像内容质量评估模型(如重复、模糊、人脸表情等),优化用户使用体验;
3)探索RAG、多模态图像大模型与文本大模型协同机制,推进agent能力的研发与实现。
二、图像AIGC方向(创作与编辑):
1)研究并落地图像生成与编辑类算法,包括背景替换、人像美化、风格迁移、文生图、图生图等应用;
2)参与基于Diffusion架构的基础模型训练工作;
3)参与ControlNet、Inpainting、aigc编辑大模型等前沿模型在业务场景中的开发与应用。
任职要求:
一、基础能力:
1)计算机、人工智能、图像处理等相关专业硕士及以上学历;
2)具备扎实的深度学习理论基础,熟练掌握PyTorch / TensorFlow等主流框架;
3)具备良好的编程能力,精通python和c++语言;
4)熟悉图像识别、检测、分割、生成等常见任务及其典型网络结构;
5)能够独立完成从算法设计、模型训练到上线调优的全流程工作。
二、加分项:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)具备模型端侧部署优化经验(如CoreML, ONNX, TensorRT等);
3)有实际产品落地经历,例如智能相册、人像美颜、图像创作类工具等;
4)了解大模型(如GPT-4V, Gemini, Claude)与视觉任务融合的应用方式。
2026-06-15 14:41
IP属地:广东深圳
职位福利
硕士5-10年图像算法深度学习大模型算法自然语言处理算法多模态算法算法工程化经验推荐算法发表算法相关优秀论文C/C++机器学习参加算法相关竞赛/获奖模型加速/性能优化Python

维沃移动通信有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










