职位详情
我们依托创新领域的海量数据,打造面向研发和知识产权从业者的智能平台,现诚邀精通计算机视觉与OCR技术的优秀人才加入。通过多模态建模与图像理解技术,共同挖掘图文数据的深层价值。你将有机会把前沿算法应用于真实业务场景,推动智能文档处理与图像分析的技术突破!
##职位描述
*多模态模型(VLM)的应用与工程落地
*文字/图像OCR及计算机视觉算法研发
*构建文档图像内容理解系统
*算法优化与前沿技术的工程化实现
##岗位职责:
1.开展多模态模型(如Qwen、LLaVA等VLM模型)的研究与应用,将预训练模型深度融入文档问答、表格抽取、图像检索等实际业务场景,解决图文交互中的关键问题。
2.负责文字OCR、图像识别、计算机视觉、机器学习与模式识别等人工智能算法的设计与开发,提升图文信息提取的精度与效率。
3.参与文档图像内容理解相关系统的设计、开发与集成,支持复杂版式文档的智能解析与结构化输出。
4.针对实际业务需求优化现有算法与系统,提升模型表现与运行性能,应对大规模数据下的工程挑战。
5.持续跟踪计算机视觉、OCR、多模态大模型等领域的最新进展,推动创新技术在产品中的工程化落地,全面提升效果、性能与用户体验。
##任职资格:
1.计算机、数学、自动化等相关理工科专业背景,本科及以上学历。
2.具备3年以上计算机视觉、图像处理或OCR领域工作经验,有成功项目落地经验者优先。
3.编程基础扎实,熟练掌握Python,熟悉深度学习模型的工程部署与优化。
4.熟悉主流深度学习框架(TensorFlow和/或PyTorch),了解Diffusion系列模型、大模型等先进技术者优先考虑。
5.具备VLM(视觉语言模型)项目经验,或在文档理解、表格识别、图像检索等应用场景中有实践经历者优先。
6.具备出色的问题分析与解决能力,富有创新意识和团队合作精神,能够快速学习并应用新兴技术于实际工作中。
##职位描述
*多模态模型(VLM)的应用与工程落地
*文字/图像OCR及计算机视觉算法研发
*构建文档图像内容理解系统
*算法优化与前沿技术的工程化实现
##岗位职责:
1.开展多模态模型(如Qwen、LLaVA等VLM模型)的研究与应用,将预训练模型深度融入文档问答、表格抽取、图像检索等实际业务场景,解决图文交互中的关键问题。
2.负责文字OCR、图像识别、计算机视觉、机器学习与模式识别等人工智能算法的设计与开发,提升图文信息提取的精度与效率。
3.参与文档图像内容理解相关系统的设计、开发与集成,支持复杂版式文档的智能解析与结构化输出。
4.针对实际业务需求优化现有算法与系统,提升模型表现与运行性能,应对大规模数据下的工程挑战。
5.持续跟踪计算机视觉、OCR、多模态大模型等领域的最新进展,推动创新技术在产品中的工程化落地,全面提升效果、性能与用户体验。
##任职资格:
1.计算机、数学、自动化等相关理工科专业背景,本科及以上学历。
2.具备3年以上计算机视觉、图像处理或OCR领域工作经验,有成功项目落地经验者优先。
3.编程基础扎实,熟练掌握Python,熟悉深度学习模型的工程部署与优化。
4.熟悉主流深度学习框架(TensorFlow和/或PyTorch),了解Diffusion系列模型、大模型等先进技术者优先考虑。
5.具备VLM(视觉语言模型)项目经验,或在文档理解、表格识别、图像检索等应用场景中有实践经历者优先。
6.具备出色的问题分析与解决能力,富有创新意识和团队合作精神,能够快速学习并应用新兴技术于实际工作中。
2026-06-29 13:30
IP属地:广东深圳
职位福利
本科3-5年图像搜索Java深度学习大模型算法多模态算法Pyt

企知道科技有限公司
未融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
计算机视觉算法工程师岗位
1.5-2.5万元/月
图像算法算法工程师3-5年本科图像搜索C/C++大模型算法图像处理库(OpenCV等)图像生成人像算法目标跟踪Python
深圳 南山区
高级视觉算法工程师
3.5-6.5万元/月
图像算法算法工程师5-10年硕士YOLOC/C++VLM3D-CNN/Transformer深度学习大模型算法图像处理库(OpenCV等)图像生成目标跟踪Python
深圳 南山区








