职位详情
岗位职责
1.视频流处理与边缘端优化
• 基于RK3588平台,使用C++/GStreamer/OpenCV实现多路实时视频流采集、解码(H.264/H.265)、抽帧(动态策略)及预处理(去噪、增强),保障低延迟(≤100ms)与高稳定性。
• 优化视频流传输与存储(本地化+云端同步),设计抽帧策略平衡带宽与算力(如关键帧优先、动态帧率调整)。
2.NPU模型部署与推理加速
• 完成PyTorch/ONNX模型在RK3588NPU上的量化(INT8/FP16)、编译(RKNN工具链)及性能调优,目标推理耗时≤30ms/帧(关键任务)。
• 开发C++推理引擎,集成目标检测(YOLOv8)、分割(MaskR-CNN)等模型,支持多任务并行推理(如检测+分类)。
3.视频图像算法开发与训练
• 主导视频图像核心任务算法研发(目标检测、多目标跟踪、行为识别、异常检测等),针对边缘端场景优化精度与速度平衡(如小目标检测、运动模糊鲁棒性)。
• 设计视频时序建模策略(光流融合、3D卷积),解决帧间依赖问题;制定数据标注规范(目标框、分割掩码、行为标签),构建高质量训练集(含复杂场景噪声、遮挡)。
• 完成模型训练全流程(PyTorch/TensorFlow):数据加载、训练调优(学习率策略、损失函数设计)、验证(mAP、FPS、误检率)及导出(ONNX/PT)、模型格式转换,支持迁移学习与小样本微调。
4.多模态模型开发与大语言模型微调
• 负责大语言模型(LLaMA、ChatGLM、BERT)的微调与优化,支持视频-文本对齐任务(视频摘要生成、目标描述、视觉问答)。
• 设计多模态特征融合策略(CLIP、FLAVA),开发跨模态推理模块;探索轻量级LLM在RK3588边缘端的部署方案(量化、蒸馏),目标推理延迟≤500ms。
5.系统对接与功能扩展
• 对接Flask+Vue管理后台,实现远端策略调整(模型下载、抽帧频率、启停控制)、设备监控(视频流状态、资源占用)及与中心算法平台的双向通信(MQTT/RESTful)。
• 支持多模态数据推送(视频分析结果+文本描述)及国产化系统(麒麟OS/OpenHarmony)适配。
任职要求
1.核心技术能力
• 编程与系统:精通C++/Python,熟悉Linux多线程编程、交叉编译、V4L2采集及H.264/H.265硬编解码;掌握RK3588开发全流程(NPU/CPU/GPU异构计算、低延迟传输)。
• 视频图像算法:深入理解CNN、Transformer、3D卷积、光流法等核心技术;熟练使用PyTorch/TensorFlow完成模型训练、调优及部署(量化、剪枝、蒸馏);掌握目标检测(YOLO系列)、分割(U-Net)等模型的改进与优化。
• 多模态与大模型:熟悉LLM架构(Transformer、LLaMA)及微调方法(LoRA、QLoRA);掌握多模态对齐技术(CLIP),具备视频-文本联合训练/微调经验;了解边缘端LLM部署工具(TensorRT-LLM、ONNXRuntime)。
2.项目经验
• 3年以上视频图像算法研发经验,需提供全流程项目案例(如“工业质检缺陷检测:mAP从82%提升至95%,边缘端FPS从15→25”);
• 有复杂场景算法适配经验(低光照、遮挡、大视角变化)或小样本/增量学习应用案例;
• 有边缘端与云端协同开发经验(如本地推理+云端精调)或开源项目贡献优先。
3.优先条件
• 熟悉视频编码与算法协同优化(H.265压缩+关键帧解码);
• 具备Flask/Vue全栈开发能力或国产化系统(麒麟OS)适配经验;
• 了解军品/工业级开发规范(加密存储、可靠性测试)。
1.视频流处理与边缘端优化
• 基于RK3588平台,使用C++/GStreamer/OpenCV实现多路实时视频流采集、解码(H.264/H.265)、抽帧(动态策略)及预处理(去噪、增强),保障低延迟(≤100ms)与高稳定性。
• 优化视频流传输与存储(本地化+云端同步),设计抽帧策略平衡带宽与算力(如关键帧优先、动态帧率调整)。
2.NPU模型部署与推理加速
• 完成PyTorch/ONNX模型在RK3588NPU上的量化(INT8/FP16)、编译(RKNN工具链)及性能调优,目标推理耗时≤30ms/帧(关键任务)。
• 开发C++推理引擎,集成目标检测(YOLOv8)、分割(MaskR-CNN)等模型,支持多任务并行推理(如检测+分类)。
3.视频图像算法开发与训练
• 主导视频图像核心任务算法研发(目标检测、多目标跟踪、行为识别、异常检测等),针对边缘端场景优化精度与速度平衡(如小目标检测、运动模糊鲁棒性)。
• 设计视频时序建模策略(光流融合、3D卷积),解决帧间依赖问题;制定数据标注规范(目标框、分割掩码、行为标签),构建高质量训练集(含复杂场景噪声、遮挡)。
• 完成模型训练全流程(PyTorch/TensorFlow):数据加载、训练调优(学习率策略、损失函数设计)、验证(mAP、FPS、误检率)及导出(ONNX/PT)、模型格式转换,支持迁移学习与小样本微调。
4.多模态模型开发与大语言模型微调
• 负责大语言模型(LLaMA、ChatGLM、BERT)的微调与优化,支持视频-文本对齐任务(视频摘要生成、目标描述、视觉问答)。
• 设计多模态特征融合策略(CLIP、FLAVA),开发跨模态推理模块;探索轻量级LLM在RK3588边缘端的部署方案(量化、蒸馏),目标推理延迟≤500ms。
5.系统对接与功能扩展
• 对接Flask+Vue管理后台,实现远端策略调整(模型下载、抽帧频率、启停控制)、设备监控(视频流状态、资源占用)及与中心算法平台的双向通信(MQTT/RESTful)。
• 支持多模态数据推送(视频分析结果+文本描述)及国产化系统(麒麟OS/OpenHarmony)适配。
任职要求
1.核心技术能力
• 编程与系统:精通C++/Python,熟悉Linux多线程编程、交叉编译、V4L2采集及H.264/H.265硬编解码;掌握RK3588开发全流程(NPU/CPU/GPU异构计算、低延迟传输)。
• 视频图像算法:深入理解CNN、Transformer、3D卷积、光流法等核心技术;熟练使用PyTorch/TensorFlow完成模型训练、调优及部署(量化、剪枝、蒸馏);掌握目标检测(YOLO系列)、分割(U-Net)等模型的改进与优化。
• 多模态与大模型:熟悉LLM架构(Transformer、LLaMA)及微调方法(LoRA、QLoRA);掌握多模态对齐技术(CLIP),具备视频-文本联合训练/微调经验;了解边缘端LLM部署工具(TensorRT-LLM、ONNXRuntime)。
2.项目经验
• 3年以上视频图像算法研发经验,需提供全流程项目案例(如“工业质检缺陷检测:mAP从82%提升至95%,边缘端FPS从15→25”);
• 有复杂场景算法适配经验(低光照、遮挡、大视角变化)或小样本/增量学习应用案例;
• 有边缘端与云端协同开发经验(如本地推理+云端精调)或开源项目贡献优先。
3.优先条件
• 熟悉视频编码与算法协同优化(H.265压缩+关键帧解码);
• 具备Flask/Vue全栈开发能力或国产化系统(麒麟OS)适配经验;
• 了解军品/工业级开发规范(加密存储、可靠性测试)。
2026-05-20 12:38
IP属地:湖北
职位福利
本科3-5年

奇策(武汉)数智科技有限公司
B轮 · 20-99人

工作地址

鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >

附近适合您的职位
CV算法研发工程师
1.5-2.5万元/月
图像算法算法工程师3-5年本科发表算法相关优秀论文C/C++机器学习目标检测大模型算法多模态算法图像处理库(OpenCV等)人像算法优秀开源项目经历Python模型加速/性能优化
武汉 江夏区

杨女士 · 奇策数智科技5日内活跃
图像算法
1.5-2.5万元/月
图像算法3-5年本科图像搜索机器学习深度学习目标检测图像处理库(OpenCV等)大模型算法多模态算法图像生成人像算法Python
武汉 江夏区

杨女士 · 奇策数智科技5日内活跃
Python图像算法工程师
1.5-2.5万元/月
图像算法3-5年本科机器学习深度学习目标检测大模型算法多模态算法传统图像算法图像处理库(OpenCV等)图像生成人像算法Python
武汉 江夏区

杨女士 · 奇策数智科技5日内活跃





