编程 Python

基于Keras中Conv1D和Conv2D的区别说明

Posted in Python onJune 19, 2020

如有错误，欢迎斧正。

我的答案是，在Conv2D输入通道为1的情况下，二者是没有区别或者说是可以相互转化的。首先，二者调用的最后的代码都是后端代码（以TensorFlow为例，在tensorflow_backend.py里面可以找到）：

x = tf.nn.convolution(
 input=x,
 filter=kernel,
 dilation_rate=(dilation_rate,),
 strides=(strides,),
 padding=padding,
 data_format=tf_data_format)

区别在于input和filter传递的参数不同，input不必说，filter=kernel是什么呢？

我们进入Conv1D和Conv2D的源代码看一下。他们的代码位于layers/convolutional.py里面，二者继承的都是基类_Conv(Layer)。

进入_Conv类查看代码可以发觉以下代码：

self.kernel_size = conv_utils.normalize_tuple(kernel_size, rank, 'kernel_size')
……#中间代码省略
input_dim = input_shape[channel_axis]
kernel_shape = self.kernel_size + (input_dim, self.filters)

我们假设，Conv1D的input的大小是（600,300），而Conv2D的input大小是（m,n,1），二者kernel_size为3。

进入conv_utils.normalize_tuple函数可以看到：

def normalize_tuple(value, n, name):
 """Transforms a single int or iterable of ints into an int tuple.
 # Arguments
 value: The value to validate and convert. Could an int, or any iterable
  of ints.
 n: The size of the tuple to be returned.
 name: The name of the argument being validated, e.g. "strides" or
  "kernel_size". This is only used to format error messages.
 # Returns
 A tuple of n integers.
 # Raises
 ValueError: If something else than an int/long or iterable thereof was
 passed.
 """
 if isinstance(value, int):
 return (value,) * n
 else:
 try:
  value_tuple = tuple(value)
 except TypeError:
  raise ValueError('The `' + name + '` argument must be a tuple of ' +
    str(n) + ' integers. Received: ' + str(value))
 if len(value_tuple) != n:
  raise ValueError('The `' + name + '` argument must be a tuple of ' +
    str(n) + ' integers. Received: ' + str(value))
 for single_value in value_tuple:
  try:
  int(single_value)
  except ValueError:
  raise ValueError('The `' + name + '` argument must be a tuple of ' +
     str(n) + ' integers. Received: ' + str(value) + ' '
     'including element ' + str(single_value) + ' of type' +
     ' ' + str(type(single_value)))
 return value_tuple

所以上述代码得到的kernel_size是kernel的实际大小，根据rank进行计算，Conv1D的rank为1，Conv2D的rank为2，如果是Conv1D，那么得到的kernel_size就是（3,）如果是Conv2D，那么得到的是（3,3）

input_dim = input_shape[channel_axis] kernel_shape = self.kernel_size + (input_dim, self.filters)

又因为以上的inputdim是最后一维大小(Conv1D中为300，Conv2D中为1），filter数目我们假设二者都是64个卷积核。

因此，Conv1D的kernel的shape实际为：

（3,300,64）

而Conv2D的kernel的shape实际为：

（3,3,1,64）

刚才我们假设的是传参的时候kernel_size=3，如果，我们将传参Conv2D时使用的的kernel_size设置为自己的元组例如（3,300），那么传根据conv_utils.normalize_tuple函数，最后的kernel_size会返回我们自己设置的元组，也即（3,300）那么Conv2D的实际shape是：

（3,300,1,64），也即这个时候的Conv1D的大小reshape一下得到，二者等价。

换句话说，Conv1D（kernel_size=3）实际就是Conv2D（kernel_size=（3,300）），当然必须把输入也reshape成（600,300,1），即可在多行上进行Conv2D卷积。

这也可以解释，为什么在Keras中使用Conv1D可以进行自然语言处理，因为在自然语言处理中，我们假设一个序列是600个单词，每个单词的词向量是300维，那么一个序列输入到网络中就是（600,300），当我使用Conv1D进行卷积的时候，实际上就完成了直接在序列上的卷积，卷积的时候实际是以（3,300）进行卷积，又因为每一行都是一个词向量，因此使用Conv1D（kernel_size=3）也就相当于使用神经网络进行了n_gram=3的特征提取了。

这也是为什么使用卷积神经网络处理文本会非常快速有效的内涵。

补充知识：Conv1D、Conv2D、Conv3D

由于计算机视觉的大红大紫，二维卷积的用处范围最广。因此本文首先介绍二维卷积，之后再介绍一维卷积与三维卷积的具体流程，并描述其各自的具体应用。

1. 二维卷积

基于Keras中Conv1D和Conv2D的区别说明

图中的输入的数据维度为

上述内容没有引入channel的概念，也可以说channel的数量为1。如果将二维卷积中输入的channel的数量变为3，即输入的数据维度变为（

以上都是在过滤器数量为1的情况下所进行的讨论。如果将过滤器的数量增加至16，即16个大小为

二维卷积常用于计算机视觉、图像处理领域。

2. 一维卷积

基于Keras中Conv1D和Conv2D的区别说明

图中的输入的数据维度为8，过滤器的维度为5。与二维卷积类似，卷积后输出的数据维度为

如果过滤器数量仍为1，输入数据的channel数量变为16，即输入数据维度为

如果过滤器数量为

一维卷积常用于序列模型，自然语言处理领域。

3. 三维卷积

基于Keras中Conv1D和Conv2D的区别说明

这里采用代数的方式对三维卷积进行介绍，具体思想与一维卷积、二维卷积相同。

假设输入数据的大小为

基于上述情况，三维卷积最终的输出为

三维卷积常用于医学领域（CT影响），视频处理领域（检测动作及人物行为）。

以上这篇基于Keras中Conv1D和Conv2D的区别说明就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

基于Keras中Conv1D和Conv2D的区别说明

- Author -

哈哈进步

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python下使用Psyco模块优化运行速度

Apr 05 Python

Python2与python3中 for 循环语句基础与实例分析

Nov 20 Python

python爬取个性签名的方法

Jun 17 Python

PyTorch中常用的激活函数的方法示例

Aug 20 Python

python单向链表的基本实现与使用方法【定义、遍历、添加、删除、查找等】

Oct 24 Python

使用NumPy读取MNIST数据的实现代码示例

Nov 20 Python

使用opencv将视频帧转成图片输出

Dec 10 Python

python爬虫开发之Beautiful Soup模块从安装到详细使用方法与实例

Mar 09 Python

Django-rest-framework中过滤器的定制实例

Apr 01 Python

Python更换pip源方法过程解析

May 19 Python

如何查看python关键字

Jan 17 Python

Python实现聚类K-means算法详解

Jul 15 Python

Python魔术方法专题

Jun 19 #Python

关于Theano和Tensorflow多GPU使用问题

Jun 19 #Python

如何对python的字典进行排序

Jun 19 #Python

浅谈Python中的继承

Jun 19 #Python

python程序需要编译吗

Jun 19 #Python

python中round函数如何使用

Jun 19 #Python

keras实现theano和tensorflow训练的模型相互转换

Jun 19 #Python

You might like

PHP set_time_limit(0)长连接的实现分析

2010/03/02 PHP

PHP获取当前日期及本周一是几月几号的方法

2017/03/28 PHP

laravel 5异常错误:FatalErrorException in Handler.php line 38的解决

2017/10/12 PHP

jquery实现的超出屏幕时把固定层变为定位层的代码

2010/02/23 Javascript

JavaScript入门之对象与JSON详解

2011/10/21 Javascript

js showModalDialog弹出窗口实例详解

2014/01/07 Javascript

jQuery选择id属性带有点符号元素的方法

2015/03/17 Javascript

Validform表单验证总结篇

2016/10/31 Javascript

js定时器实例分享

2016/12/20 Javascript

利用jquery实现实时更新歌词的方法

2017/01/06 Javascript

JS中SetTimeout和SetInterval使用初探

2017/03/23 Javascript

原生JavaScript来实现对dom元素class的操作方法(推荐)

2017/08/16 Javascript

详解JS数值Number类型

2018/02/07 Javascript

详解iframe跨域的几种常用方法(小结)

2019/04/29 Javascript

基于Vue 撸一个指令实现拖拽功能

2019/10/09 Javascript

vue Tab切换以及缓存页面处理的几种方式

2019/11/05 Javascript

js判断一个对象是数组（函数）的方法实例

2019/12/19 Javascript

小程序外卖订单界面的示例代码

2019/12/30 Javascript

JavaScript React如何修改默认端口号方法详解

2020/07/28 Javascript

[01:42]辉夜杯战队访谈宣传片—FANTUAN

2015/12/25 DOTA

利用Python脚本实现ping百度和google的方法

2017/01/24 Python

python将unicode转为str的方法

2017/06/21 Python

tensorflow更改变量的值实例

2018/07/30 Python

3分钟学会一个Python小技巧

2018/11/23 Python

python引用(import)某个模块提示没找到对应模块的解决方法

2019/01/19 Python

Python3 JSON编码解码方法详解

2019/09/06 Python

django框架基于queryset和双下划线的跨表查询操作详解

2019/12/11 Python

TensorFlow绘制loss/accuracy曲线的实例

2020/01/21 Python

Python图像处理库PIL的ImageFont模块使用介绍

2020/02/26 Python

Python实现猜年龄游戏代码实例

2020/03/25 Python

利用OpenCV中对图像数据进行64F和8U转换的方式

2020/06/03 Python

HTML5之tabindex属性全面解析

2016/07/07 HTML / CSS

英国最大的海报商店：GB Posters

2018/03/20 全球购物

Kappa英国官方在线商店：服装和运动器材

2020/11/22 全球购物

酒店端午节活动方案

2014/08/26 职场文书

2015教师年度工作总结范文

2015/04/07 职场文书