图像CV与OCR算法研发工程师

3-6万元/月

深圳·南山区

岳先生

已实名

企业认证

企知道科技有限公司

职位详情

图像算法

我们依托创新领域的海量数据，打造面向研发和知识产权从业者的智能平台，现诚邀精通计算机视觉与OCR技术的优秀人才加入。通过多模态建模与图像理解技术，共同挖掘图文数据的深层价值。你将有机会把前沿算法应用于真实业务场景，推动智能文档处理与图像分析的技术突破！

##职位描述
*多模态模型（VLM）的应用与工程落地
*文字/图像OCR及计算机视觉算法研发
*构建文档图像内容理解系统
*算法优化与前沿技术的工程化实现

##岗位职责：
1.开展多模态模型（如Qwen、LLaVA等VLM模型）的研究与应用，将预训练模型深度融入文档问答、表格抽取、图像检索等实际业务场景，解决图文交互中的关键问题。
2.负责文字OCR、图像识别、计算机视觉、机器学习与模式识别等人工智能算法的设计与开发，提升图文信息提取的精度与效率。
3.参与文档图像内容理解相关系统的设计、开发与集成，支持复杂版式文档的智能解析与结构化输出。
4.针对实际业务需求优化现有算法与系统，提升模型表现与运行性能，应对大规模数据下的工程挑战。
5.持续跟踪计算机视觉、OCR、多模态大模型等领域的最新进展，推动创新技术在产品中的工程化落地，全面提升效果、性能与用户体验。

##任职资格：
1.计算机、数学、自动化等相关理工科专业背景，本科及以上学历。
2.具备3年以上计算机视觉、图像处理或OCR领域工作经验，有成功项目落地经验者优先。
3.编程基础扎实，熟练掌握Python，熟悉深度学习模型的工程部署与优化。
4.熟悉主流深度学习框架（TensorFlow和/或PyTorch），了解Diffusion系列模型、大模型等先进技术者优先考虑。
5.具备VLM（视觉语言模型）项目经验，或在文档理解、表格识别、图像检索等应用场景中有实践经历者优先。
6.具备出色的问题分析与解决能力，富有创新意识和团队合作精神，能够快速学习并应用新兴技术于实际工作中。

2026-06-29 13:30

IP属地：广东深圳

职位福利

本科3-5年图像搜索Java深度学习大模型算法多模态算法Pyt