职位详情
岗位职责:
作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件聚类、情绪判断、场景分类等任务;建立个性化的图像语义标签体系;
2)构建图像内容质量评估机制(如重复性、清晰度、人脸表情状态等),优化用户使用体验;
3)探索RAG、多模态大模型与文本大模型协同下的agent能力开发与实现路径。
二、图像AIGC方向(创作与编辑):
1)开展图像生成与编辑算法研究,包括背景更换、人像增强、风格转换、文本生成图像、图像生成图像等方向;
2)参与基于Diffusion架构的基础模型训练工作;
3)推进ControlNet、Inpainting、AIGC编辑大模型等前沿模型在业务场景中的应用与落地。
任职要求:
一、基础能力:
1)计算机、人工智能、图像处理等相关专业硕士或以上学位;
2)具备扎实的深度学习理论基础,熟练使用PyTorch / TensorFlow等主流框架;
3)具备良好的编程能力,精通python和c++语言;
4)掌握图像识别、检测、分割、生成等典型任务及其常用网络结构;
5)能够独立完成从算法设计、模型训练到上线优化的全流程工作。
二、加分项:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)有模型端侧部署及性能优化实践经验;
3)有实际产品化经验,例如智能相册、人像美颜、图像创作类工具等;
4)了解大模型(如 GPT-4V, Gemini, Claude)在视觉任务中的融合应用。
作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件聚类、情绪判断、场景分类等任务;建立个性化的图像语义标签体系;
2)构建图像内容质量评估机制(如重复性、清晰度、人脸表情状态等),优化用户使用体验;
3)探索RAG、多模态大模型与文本大模型协同下的agent能力开发与实现路径。
二、图像AIGC方向(创作与编辑):
1)开展图像生成与编辑算法研究,包括背景更换、人像增强、风格转换、文本生成图像、图像生成图像等方向;
2)参与基于Diffusion架构的基础模型训练工作;
3)推进ControlNet、Inpainting、AIGC编辑大模型等前沿模型在业务场景中的应用与落地。
任职要求:
一、基础能力:
1)计算机、人工智能、图像处理等相关专业硕士或以上学位;
2)具备扎实的深度学习理论基础,熟练使用PyTorch / TensorFlow等主流框架;
3)具备良好的编程能力,精通python和c++语言;
4)掌握图像识别、检测、分割、生成等典型任务及其常用网络结构;
5)能够独立完成从算法设计、模型训练到上线优化的全流程工作。
二、加分项:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)有模型端侧部署及性能优化实践经验;
3)有实际产品化经验,例如智能相册、人像美颜、图像创作类工具等;
4)了解大模型(如 GPT-4V, Gemini, Claude)在视觉任务中的融合应用。
2026-05-15 13:45
IP属地:江苏南京
职位福利
硕士3-5年AI图像算法智能相册系统

维沃移动通信有限公司
不需要融资 · 500-999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >











