Python快乐编程:人工智能深度学习基础
上QQ阅读APP看书,第一时间看更新

2.4 Theano中的符号变量

使用编程语言进行编程时,需要用到各种变量来存储各种数据信息,Theano虽然是基于Python和Numpy实现的数值计算工具库,但有自己独立的变量体系。Theano的变量类型被称为符号变量(Tensor Variable),它是Theano表达式和运算操作的基本单元。Theano中所有符号变量都来源于一个基类:Tensorvariable(),即这些符号变量都是这个类的实例化,而这些符号变量本身的数据类型,通过实例化给定,通过访问对象属性得到object.type,它们在Theano的tensor模块中。

一般情况下,首先需要导入Theano,否则会返回异常。Theano目前支持7种变量类型:col、matrix、row、scalar、tensor3、tensor4、vector。接下来演示如何使用内置方法定义向量类型的变量,具体如下所示:

    >>>import theano
    >>>import theano.tensor as T
    >>>x = T.vector(name = '变量名称',dtype = '该实例化的符号变量的数据类型')

其中,vector()函数需要指定以下两个参数:

· name——指定变量的名称。

· dtype——指定变量的数据类型。目前Theano变量支持的数据类型有8种:int8、int16、int32、int64、float32、float64、complex64、complex128。

在创建其他类型的变量时,将vector替换成对应的变量类型即可,比如通过将vector替换成matrix即可创建矩阵类型的变量:T.matrix。

表2.1列出了常见的符号类型以及符号变量的数据类型。

表2.1 常见的符号类型

续表

表2.1的第一列是符号变量的类型,第二列是符号变量的数据类型,最后一列broadcastable属性的作用是表示不同维度的矩阵之间是否可以广播。

上述使用Theano内置的变量定义方法,只适用于处理四维以下的变量,当需要处理更高维的数据时,需要采用自定义变量类型的方法进行定义,自定义变量的一般形式如下所示:

    >>>import theano
    >>>import theano.tensor as T
    >>>mytype = T.TensorType(dtype,broadcastable

使用上述TensorType函数进行自定义变量操作时,dtype和broadcastable是必须指定的参数。

· dtype:指定变量的数据类型。目前Theano变量支持的数据类型有8种:int8、int16、int32、int64、float32、float64、complex64、complex128。

· broadcastable:是一个由True或False值构成的布尔类型元组,元组的大小等于变量的维度大小,如果元组中的某一个值为True,则表示变量在对应的维度上的数据可以进行广播(broadcast),否则数据不能广播。

接下来分别演示几种常见的变量定义方法。

返回一个零维的numpy.ndarray:

    >>>theano.tensor.scalar(name = None, dtype = config.floatX)

返回一个一维的numpy.ndarray:

    >>>theano.tensor.vector(name = None, dtype = config.floatX)

返回一个二维的numpy.ndarray,但是行数保证是1:

    >>>theano.tensor.row(name = None, dtype = config.floatX)

返回一个二维的numpy.ndarray,但是列数保证是1:

    >>>theano.tensor.col(name = None, dtype = config.floatX)

返回一个二维的numpy.ndarray:

    >>>theano.tensor.matrix(name = None, dtype = config.floatX)

返回一个三维的numpy.ndarray:

    >>>theano.tensor.tensor3(name = None, dtype = config.floatX)

返回一个四维的numpy.ndarray:

    >>>theano.tensor.tensor4(name = None, dtype = config.floatX)

如果想要创建一个非标准的类型的变量,就需要用到自定义的TensorType。这需要将dtype和broadcasting pattern传入声明函数中。

创建一个五维向量的代码如下所示。

    dtensor5 = TensorType('float64',(False,)*5)
    x = dtensor5()
    z = dtensor5('z')

可以通过以下代码对已存在的类型进行重构。

    my_dmatrix = TensorType('float64',(False,)*2)
    x = my_dmatrix()                    #定义一个矩阵变量
    print my_dmatrix == dmatrix         #输出为"True"

图2.11 广播的运算机制

TensorType函数有一个重要的参数broadcastable,该参数对变量是否可以进行广播产生影响。广播机制使得不同维度的张量进行加法或者乘法运算成为可能,它可以让程序直接执行异构数据间的运算操作,避开异构数据间运算时维度转换的过程。例如,将一个向量数据与一个高维矩阵相加,如果没有广播的机制,则需要先将低维的数据转换成高维数据才能进行相应的操作符运算。通过广播机制,标量可以直接与矩阵相加,向量可以直接和矩阵相加,标量可以直接和向量相加,广播的运算机制如图2.11所示。

图2.11演示了广播一个行矩阵的过程,其中,T和F分别表示True和False,表示广播沿着哪个维度进行。如果第二个参数是向量,那么它的维度为(2,),广播模式为(False,)。它将会自动向左展开,匹配矩阵的维度,最终得到维度为(1,2)和Boradcastable为(True,False)。

与numpy的广播机制不同,Theano需要知道哪些维度需要进行广播。当维度可以广播时,广播信息将会以变量的类型给出。

下面的代码演示了在向量和矩阵的加法运算过程中,行和列是如何进行广播的:

接下来通过TensorType方法创建一个五维张量类型,将其broadcastable设置成(False,)∗5。此时,通过自定义方法新使创建的变量在5个维度上都不再支持广播机制。

    import theano
    import theano.tensor as T
    mytype = T.TensorType('float32',(False,)*5)
    data = mytype('x')
    data.type()

结果如下所示:

    <TensorType(float32,5D)>

从结果可以看出,已经成功修改了所创建变量的属性,使其在5个维度上不再支持广播。