快速R-CNN中ROI层的目的是什么?
computer-vision
conv-neural-network
deep-learning
object-detection
8
0

在有关对象检测的教程中,提到了快速R-CNN。还提到了ROI(感兴趣区域)层。

从数学上讲,当根据最终卷积层激活函数(在每个单元中)调整区域建议的大小时,会发生什么情况?

参考资料:
Stack Overflow
收藏
评论
共 2 个回答
高赞 时间 活跃

兴趣区域(RoI)池:

它是一种池化层,可对大小不一的输入(此处为convnet特征图)执行最大池化 ,并生成固定大小(例如7x7)的小特征图。该固定大小的选择是网络超参数,并且是预定义的。

进行此类合并的主要目的是加快培训和测试时间,并从端到端(以联合方式)培训整个系统。

由于使用了此池化层,因此与原始(香草?)R-CNN体系结构相比,训练和测试时间更快,因此命名为Fast R-CNN。

简单的例子(来自deepsense.io解释的兴趣区域合并 ):

RoI池的可视化

收藏
评论

快速R-CNN中引入了ROI(关注区域)层,这是在深度卷积网络的空间金字塔池中引入了视觉金字塔的空间金字塔池层的特例。 ROI层的主要功能是由于完全连接层中的尺寸限制,将任意大小的输入整形为固定长度的输出。

ROI层的工作方式如下所示:

在此处输入图片说明

在此图像中,具有任意大小的输入图像被馈入具有3个不同窗口的该层:4x4(蓝色),2x2(绿色),1x1(灰色),以产生固定大小为16 x F,4 x F,和1 x F,其中F是过滤器的数量。然后,将这些输出串联到一个向量中,以馈入全连接层。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号