基本概念介绍
目标检测的四个基本步骤:
- 候选区域生成
- 特征提取
- 分类
- 位置精修
RCNN的算法:
- 将一张图片生成2K个候选区域;
- 对每个候选区域,使用深度网络(deep net)提取特征;
- 特征送入每一类的SVM分类器,判别是否属于该类;
- 使用回归器精细修正候选框的位置;
从RCNN到fast RCNN,再到faster RCNN,目标检测的四个基本步骤终于被统一到一个深度网络框架之内。所有计算没有重复,完全在GPU中完成,大大提高了运行速度。
fast RCNN在RCNN的基础之上,将分类和位置精修统一到了一个深度网络之内。faster RCNN可以简单地看做“区域生成网络+fast RCNN“的系统,用区域生成网络代替fast RCNN中的Selective Search方法。