职位详情
图像CV和OCR算法工程师
我们依托创新领域海量数据,打造面向研发和IP人的智能平台,正亟需掌握计算机视觉与OCR技术的专业人才,通过多模态建模与图像理解手段,挖掘图文数据的深层价值。加入我们,你将有机会将先进算法应用于真实业务场景,推动智能文档处理与图像分析的技术革新!简历请投:
##职位描述
*多模态模型(VLM)应用与工程落地
*文字/图像OCR及计算机视觉算法研发
*构建文档图像内容理解系统
*算法性能优化与前沿技术实践
##岗位职责:
1.开展多模态模型(如Qwen、LLaVA等VLM模型)的研究与落地工作,结合预训练模型实现文档问答、表格抽取、图像检索等实际应用场景,解决图文融合中的关键技术难题。
2.负责文字OCR、图像识别、计算机视觉、机器学习与模式识别等AI算法的设计与开发,提升图文信息提取的精度与处理效率。
3.参与文档图像理解相关系统的架构设计、功能开发与系统集成,支持复杂版式文档的智能化解析与结构化输出。
4.针对业务需求优化现有算法模型与系统性能,提升效果表现与运行效率,应对大规模数据下的工程挑战。
5.持续关注计算机视觉、OCR、多模态大模型等方向的技术动态,推动新技术在产品中的工程化落地,实现效果、性能与体验的全面提升。
##任职资格:
1.计算机、数学、自动化等相关理工科专业背景,本科及以上学历。
2.具备3年以上计算机视觉、图像处理、OCR等领域工作经验,有成功项目落地经历。
3.编程基础扎实,精通Python,熟悉深度学习模型的工程部署与实现流程。
4.熟练使用主流深度学习框架(TensorFlow和/或PyTorch),了解Diffusion系列模型、大模型技术者优先考虑。
5.具备VLM(视觉语言模型)项目经验,或在文档理解、表格识别、图像检索等场景中有实际开发者优先。
6.具有较强的问题分析与解决能力,富有创新意识和团队合作精神,能快速学习并应用新兴技术于实际任务中。
我们依托创新领域海量数据,打造面向研发和IP人的智能平台,正亟需掌握计算机视觉与OCR技术的专业人才,通过多模态建模与图像理解手段,挖掘图文数据的深层价值。加入我们,你将有机会将先进算法应用于真实业务场景,推动智能文档处理与图像分析的技术革新!简历请投:
##职位描述
*多模态模型(VLM)应用与工程落地
*文字/图像OCR及计算机视觉算法研发
*构建文档图像内容理解系统
*算法性能优化与前沿技术实践
##岗位职责:
1.开展多模态模型(如Qwen、LLaVA等VLM模型)的研究与落地工作,结合预训练模型实现文档问答、表格抽取、图像检索等实际应用场景,解决图文融合中的关键技术难题。
2.负责文字OCR、图像识别、计算机视觉、机器学习与模式识别等AI算法的设计与开发,提升图文信息提取的精度与处理效率。
3.参与文档图像理解相关系统的架构设计、功能开发与系统集成,支持复杂版式文档的智能化解析与结构化输出。
4.针对业务需求优化现有算法模型与系统性能,提升效果表现与运行效率,应对大规模数据下的工程挑战。
5.持续关注计算机视觉、OCR、多模态大模型等方向的技术动态,推动新技术在产品中的工程化落地,实现效果、性能与体验的全面提升。
##任职资格:
1.计算机、数学、自动化等相关理工科专业背景,本科及以上学历。
2.具备3年以上计算机视觉、图像处理、OCR等领域工作经验,有成功项目落地经历。
3.编程基础扎实,精通Python,熟悉深度学习模型的工程部署与实现流程。
4.熟练使用主流深度学习框架(TensorFlow和/或PyTorch),了解Diffusion系列模型、大模型技术者优先考虑。
5.具备VLM(视觉语言模型)项目经验,或在文档理解、表格识别、图像检索等场景中有实际开发者优先。
6.具有较强的问题分析与解决能力,富有创新意识和团队合作精神,能快速学习并应用新兴技术于实际任务中。
2026-06-19 14:05
IP属地:广东深圳
职位福利
本科5-10年layout机器学习计算机视觉图像处理VLM深度学习多模态算法image search优秀开源项目经历PythonOCR

企知道科技有限公司
未融资 · 1000-9999人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
高级图像算法研发工程师
3-6万元/月
图像算法3-5年本科深度学习图像增强ISP/3A算法图像生成并行计算嵌入式开发优秀开源项目经历发表算法相关优秀论文C/C++图像处理库(OpenCV等)传统图像算法参加算法相关竞赛/获奖人像算法
深圳










