兴趣区域(RoI)池:
它是一种池化层,可对大小不一的输入(此处为convnet特征图)执行最大池化 ,并生成固定大小(例如7x7)的小特征图。该固定大小的选择是网络超参数,并且是预定义的。
进行此类合并的主要目的是加快培训和测试时间,并从端到端(以联合方式)培训整个系统。
由于使用了此池化层,因此与原始(香草?)R-CNN体系结构相比,训练和测试时间更快,因此命名为Fast R-CNN。
简单的例子(来自deepsense.io解释的兴趣区域合并 ):
0
兴趣区域(RoI)池:
它是一种池化层,可对大小不一的输入(此处为convnet特征图)执行最大池化 ,并生成固定大小(例如7x7)的小特征图。该固定大小的选择是网络超参数,并且是预定义的。
进行此类合并的主要目的是加快培训和测试时间,并从端到端(以联合方式)培训整个系统。
由于使用了此池化层,因此与原始(香草?)R-CNN体系结构相比,训练和测试时间更快,因此命名为Fast R-CNN。
简单的例子(来自deepsense.io解释的兴趣区域合并 ):
0
在快速R-CNN中引入了ROI(关注区域)层,这是在深度卷积网络的空间金字塔池中引入了视觉金字塔的空间金字塔池层的特例。 ROI层的主要功能是由于完全连接层中的尺寸限制,将任意大小的输入整形为固定长度的输出。
ROI层的工作方式如下所示:
在此图像中,具有任意大小的输入图像被馈入具有3个不同窗口的该层:4x4(蓝色),2x2(绿色),1x1(灰色),以产生固定大小为16 x F,4 x F,和1 x F,其中F是过滤器的数量。然后,将这些输出串联到一个向量中,以馈入全连接层。
0
在有关对象检测的本教程中,提到了快速R-CNN。还提到了ROI(感兴趣区域)层。
从数学上讲,当根据最终卷积层激活函数(在每个单元中)调整区域建议的大小时,会发生什么情况?