图像CV与OCR算法研发工程师

2.5-5万元/月

深圳

岳先生

已实名

企业认证

企知道科技有限公司

职位详情

图像算法

图像CV和OCR算法工程师
我们依托创新领域海量数据，打造面向研发和IP人的智能平台，正亟需掌握计算机视觉与OCR技术的专业人才，通过多模态建模与图像理解手段，挖掘图文数据的深层价值。加入我们，你将有机会将先进算法应用于真实业务场景，推动智能文档处理与图像分析的技术革新！简历请投：

##职位描述
*多模态模型（VLM）应用与工程落地
*文字/图像OCR及计算机视觉算法研发
*构建文档图像内容理解系统
*算法性能优化与前沿技术实践

##岗位职责：
1.开展多模态模型（如Qwen、LLaVA等VLM模型）的研究与落地工作，结合预训练模型实现文档问答、表格抽取、图像检索等实际应用场景，解决图文融合中的关键技术难题。
2.负责文字OCR、图像识别、计算机视觉、机器学习与模式识别等AI算法的设计与开发，提升图文信息提取的精度与处理效率。
3.参与文档图像理解相关系统的架构设计、功能开发与系统集成，支持复杂版式文档的智能化解析与结构化输出。
4.针对业务需求优化现有算法模型与系统性能，提升效果表现与运行效率，应对大规模数据下的工程挑战。
5.持续关注计算机视觉、OCR、多模态大模型等方向的技术动态，推动新技术在产品中的工程化落地，实现效果、性能与体验的全面提升。

##任职资格：
1.计算机、数学、自动化等相关理工科专业背景，本科及以上学历。
2.具备3年以上计算机视觉、图像处理、OCR等领域工作经验，有成功项目落地经历。
3.编程基础扎实，精通Python，熟悉深度学习模型的工程部署与实现流程。
4.熟练使用主流深度学习框架（TensorFlow和/或PyTorch），了解Diffusion系列模型、大模型技术者优先考虑。
5.具备VLM（视觉语言模型）项目经验，或在文档理解、表格识别、图像检索等场景中有实际开发者优先。
6.具有较强的问题分析与解决能力，富有创新意识和团队合作精神，能快速学习并应用新兴技术于实际任务中。

2026-06-19 14:05

IP属地：广东深圳

职位福利

本科5-10年layout机器学习计算机视觉图像处理VLM深度学习多模态算法image search优秀开源项目经历PythonOCR