首页技术正文

#Deep Learning回顾#之基于深度学习的目标检测（阅读小结）

工程师子博技术 2022年11月17日

0 收藏 885 点赞 2,212 浏览 843 个字

原文链接：https://www.52ml.net/20287.html

这篇博文主要讲了深度学习在目标检测中的发展。

博文首先介绍了传统的目标检测算法过程：

传统的目标检测一般使用滑动窗口的框架，主要包括三个步骤：

利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域；
提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征；行人检测和普通目标检测常用的HOG特征等；
利用分类器进行识别，比如常用的SVM模型。

基于深度学习的目标检测分为两派：

基于区域提名的，如R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN；
端到端（End-to-End），无需区域提名的，如YOLO、SSD。

目前来说，基于区域提名的方法依然占据上风，但端到端的方法速度上优势明显，后续的发展拭目以待。

接下来是对相关研究的详细介绍。

1、首先介绍的是区域提名–选择性搜索，以及用深度学习做目标检测的早期工作–Overfeat。

选择性搜索：不断迭代合并候选区域，已被弃用。

OverFeat: 用CNN做分类、定位和检测的经典之作（马克一记）。

2、基于区域提名的方法：主要介绍R-CNN系列

R-CNN:之前的工作都是用滑动窗口的方式，速度很慢，R-CNN采用的是selective search。

它和OverFeat类似，但缺点是速度慢。

SPP-net：针对剪裁技术可能出现的问题，SPP不管是对整副图像还是裁剪后的图像，都提取

相同维度的特征，这样可以统一送至全连接层。

FAST R-CNN:主要解决2000个候选框带来的重复计算问题。

FASTER R-CNN：抛弃了selective search，引入了RPN网格。

R-FCN：将最后的全连接层换为了卷积层。

3、端到端（end-to-end）:无需区域提名

YOLO：将448*448的图像分成S*S的网络，简化目标检测流程；

SSD: YOLO的改进，分为两部分：图像分类的网络和多尺度特征映射网络。

目标检测还存在一些问题，比如小目标检测问题。

区域图像特征的是目标

工程师子博

贡献者

上一篇：回望2017，基于深度学习的NLP研究大盘点

下一篇：【OCR技术系列之四】基于深度学习的文字识别（3755个汉字）

相关推荐

python开发_常用的python模块及安装方法

adodb：我们领导推荐的数据库连接组件bsddb3：BerkeleyDB的连接组件Cheetah-1.0：我比较喜欢这个版本的cheeta…

程序员润宾技术

日期：2022-11-24 点赞：878 阅读：9,078

Educational Codeforces Round 11 C. Hard Process 二分

C. Hard Process题目连接：http://www.codeforces.com/contest/660/problem/CDes…

程序员春广技术

日期：2022-11-24 点赞：807 阅读：5,553

下载Ubuntn 17.04 内核源代码

zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…

程序员峰军技术

日期：2022-11-24 点赞：569 阅读：6,402

可用Active Desktop Calendar V7.86 注册码序列号

可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…

程序员天赐技术

日期：2022-11-24 点赞：733 阅读：6,177

Android调用系统相机、自定义相机、处理大图片

Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式，并且由于涉及到要把拍到的照片显…

程序员爱鹏技术

日期：2022-11-24 点赞：512 阅读：7,814

Struts的使用

一、Struts2的获取　　Struts的官方网站为：http://struts.apache.org/　　下载完Struts2的jar包,…

程序员红卫技术

日期：2022-11-24 点赞：671 阅读：4,898

个人收藏笔记记录

开通VIP