加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

浅谈计较机视觉中的方针检测

发布时间:2020-06-04 12:59:37 所属栏目:运营 来源:站长网
导读:方针检测是属于计较机视觉领域的重要研究偏向,传统方针检测首要是基于统计或常识的要领,连年来,跟着深度进修的成长,对方针检测的研究逐渐由传统呆板视觉算法转移到深度神经收集偏向。 计较机领略图像的使命表述可以分为分类、检测、语义支解、实例支解

  方针检测是属于计较机视觉领域的重要研究偏向,传统方针检测首要是基于统计或常识的要领,连年来,跟着深度进修的成长,对方针检测的研究逐渐由传统呆板视觉算法转移到深度神经收集偏向。

  计较机领略图像的使命表述可以分为分类、检测、语义支解、实例支解4个条理,方针检测是个中一个条理。

bd3eb13533fa828bab21c0568296fd32960a5a90.jpeg

  图1:图像领略的4个条理 图片来历:[1]

  a是分类(Classification),是将图像分成差异的种别,只需输出图像对应的种别,是最基本的图像领略使命,在应用规模,人脸辨认、手势辨认等都可以归为分类使命。

  b是检测(Detection), 检测是要按照大量预界说的种别同时得到统一帧图像中各类方针的种别信息和位置信息,必要从图像疏散出方针并输出这一方针的种别和位置,检测模子的输出凡是是包括种别和位置的数据列表。

  c是语义支解(Semantic segmentation),语义支解是是对前配景分类的拓展,要分分开具有差异语义的图像部门,也可对图像像素级描写。

  d是实例支解(Instance segmentation),实例支解是检测使命的拓展,要疏散配景并描写出方针的外观,对图像像素级描写,合用于领略要求风雅的场景。

  一)传统方针检测

  1、基于常识的要领

  焦点头脑是模块化。以人脸检测为例,它将人脸分别成眼、鼻、嘴等各个模块的组合,操作先验常识来辨认各个模块,同时基于各个模块之间的间隔来举办人脸的辨认。

  2、基于统计的要领

  首要基于统计进修,将整个待检测图片看作一个像素矩阵,操作其统计特征团结一些呆板进修的算法举办辨认,譬喻Fisher线性鉴别。

  二)深度进修方针检测

  1.单阶段(one-stage)检测模子

  单阶段模子没有中间的地区检出进程,直接从图片得到猜测功效,也被称为Region-free要领,单阶段模子只举办一次种别猜测和位置回归,卷积运算的共享水平更高,拥有更快的速率和更小的内存占用。代表算法有YOLO、SSD算法等。

  1b4c510fd9f9d72a6078378355a39432359bbb9b.jpeg

  图2:YOLO收集架构 图片来历:[2]

  YOLO论文链接:https://arxiv.org/abs/1506.02640

  9a504fc2d5628535d48dfdd11066cac0a6ef6364.jpeg

  图3:SSD收集架构 图片来历:[3]

  SSD论文链接:https://arxiv.org/abs/1512.02325

  2. 两阶段(two-stage)检测模子

  两阶段模子对图片分两阶段处理赏罚,也称为基于地区(Region-based)的要领。譬喻RCNN是先提出多少也许包括物体的候选地区(即图片的局部地区,称为Region Proposal),RCNN行使的是Selective Search算法;再在提出的这些地区上运行分类收集检测出每个地区的物体。代表算法有RCNN、Fast-RCNN、Faster-RCNN 等。

  63d0f703918fa0ecd59d4734a61ee5e83c6ddbc5.jpeg

  图4:RCNN收集架构 图片来历:百度

  RCNN论文链接:https://arxiv.org/abs/1311.2524

  08f790529822720e14193c9cfb42b640f31fab15.jpeg

  图5:Fast-RCNN收集架构 图片来历:百度

  Fast-RCNN论文链接:https://arxiv.org/abs/1504.08083

  进入深度进修期间以来,方针检测成长首要齐集在两个偏向:第一种是one stage算法,如YOLO系列,这类算法会直接在收集中提取特性来猜测物体分类和位置,这类算法速率快,可是精确性要低一些。第二种是two stage算法,如RCNN系列,这类算法必要天赋生region proposal(方针候选框),然后再对候选框举办筛选、分类和回归,这类算法精确度较高,可是速率相对较慢。

  跟着科技的成长,信托计较机视觉技能可以辅佐我们提取、说明和领略更多更有效的信息,使我们的糊口越来越智能化。

  faf2b2119313b07e27455baa735e2d2596dd8c2c.jpeg

  图6:Faster-RCNN收集架构 图片来历:

  Faster-RCNN论文链接:https://arxiv.org/abs/1506.01497

  [1]从R-CNN到RFBNet,方针检测架构5年演进通盘货

  [2] You Only Look Once:Real-Time Object Detection

  [3] SSD: Single Shot Multibox Detector

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读