二维码

我们如何为卷积神经网络(CNN)的卷积层选择滤波器?

2139 人阅读 | 时间:2018年12月02日 10:06
我已经阅读了一些关于CNN的文章,其中大部分都有关于卷积层及其设计的简单解释,但它们没有解释如何构建ConvLayer中使用的过滤器。哪些过滤器是那些?我怎么能建立这些过滤器?

热门答案

亲爱的Marwa Braiki,
卷积神经网络(通常)是用于图像/对象识别的监督方法。这意味着您需要使用一组带标签的图像训练CNN:这允许优化其卷积滤波器的权重,从而学习滤波器对其进行整形,以最小化误差。
一旦确定了过滤器的大小,尽管过滤器的初始化对于“指导”学习很重要,但您确实可以将它们初始化为随机值,并让学习完成工作。
恩里科
您可以开始尝试了解您的问题所需。
例如,对于图像识别问题,如果您认为网络需要大量像素来识别对象,您将使用大型过滤器(如11x11或9x9)。如果您认为对象的区别是一些小的和局部的功能,您应该使用小型过滤器(3x3或5x5)。
这些是一些提示,但不存在任何规则,最好的方法是测试一些不同的体系结构。如果存在使用CNN解决问题的论文,您可以尝试使用相同的架构并进行更改。否则,Alexnet是一个很好的起点。

所有答案11 

虽然我没有太多想法,但您可以尝试使用矩阵中随机1和0的不同过滤器。每个滤镜捕获图像的不同特征,最终有助于识别单词。 
您可以开始尝试了解您的问题所需。
例如,对于图像识别问题,如果您认为网络需要大量像素来识别对象,您将使用大型过滤器(如11x11或9x9)。如果您认为对象的区别是一些小的和局部的功能,您应该使用小型过滤器(3x3或5x5)。
这些是一些提示,但不存在任何规则,最好的方法是测试一些不同的体系结构。如果存在使用CNN解决问题的论文,您可以尝试使用相同的架构并进行更改。否则,Alexnet是一个很好的起点。
亲爱的Marwa Braiki,
卷积神经网络(通常)是用于图像/对象识别的监督方法。这意味着您需要使用一组带标签的图像训练CNN:这允许优化其卷积滤波器的权重,从而学习滤波器对其进行整形,以最小化误差。
一旦确定了过滤器的大小,尽管过滤器的初始化对于“指导”学习很重要,但您确实可以将它们初始化为随机值,并让学习完成工作。
恩里科
正如Enrico上面提到的那样,你不会修复滤波器系数,而是通过几次迭代训练来学习它们。初始化可以是随机的,或者可以基于预先训练的模型权重(例如来自github repos中的'modelzoo'的流行模型,例如Alexnet,VGG等)
马尔瓦,
我想补充一下Enrico的答案,你可以用无监督学习中学到的功能初始化过滤器。K-means是一个良好的开端,它是一种简单的算法,实现起来非常快。
至于尺寸,我相信接受领域是最重要的。感受野是连续堆叠在彼此顶部的过滤器层的结果。不要忘记考虑池化层。
一般来说,更深层次的架构更好,这意味着您应该支持小型过滤器。
最后,根据机器的内存,有时您只需要处理机器可以处理的内容。
非常感谢你的回答
你能说明如何准确循环训练数据吗?我的意思是,如果我有一个大的训练数据集,将过滤器初始化为随机值,运行前向和后向传播..然后如何移动到下一个纪元?
使用获得的滤镜作为下一张图像的初始滤镜?因为我很困惑,我起初认为有一些与过滤器(内核)无关的权重,然后意识到过滤器是权重。
“初始化......,或者可以基于预先训练的模型权重”。这是否意味着所有隐藏层的内核最初可能相似?
由于CNN的隐藏层用作可训练的特征提取器,因此基于较大数量的像素的更详细内容将需要更大的滤波器尺寸。但是,对于需要更多关注本地化差异的情况,需要更小的过滤器尺寸。
先生
我们如何将ECG信号作为CNN的输入?
哪个类要用?
请帮忙..!
提前致谢


©著作权归作者所有:来自ZhiKuGroup博客作者没文化的原创作品,如需转载,请注明出处,否则将追究法律责任 来源:ZhiKuGroup博客,欢迎分享。

评论专区
  • 昵 称必填
  • 邮 箱选填
  • 网 址选填
◎已有 0 人评论
搜索
作者介绍
30天热门
×
×
本站会员尊享VIP特权,现在就加入我们吧!登录注册×
»
会员登录
新用户注册
×
会员注册
已有账号登录
×