2.4 Theano中的符号变量
使用编程语言进行编程时,需要用到各种变量来存储各种数据信息,Theano虽然是基于Python和Numpy实现的数值计算工具库,但有自己独立的变量体系。Theano的变量类型被称为符号变量(Tensor Variable),它是Theano表达式和运算操作的基本单元。Theano中所有符号变量都来源于一个基类:Tensorvariable(),即这些符号变量都是这个类的实例化,而这些符号变量本身的数据类型,通过实例化给定,通过访问对象属性得到object.type,它们在Theano的tensor模块中。
一般情况下,首先需要导入Theano,否则会返回异常。Theano目前支持7种变量类型:col、matrix、row、scalar、tensor3、tensor4、vector。接下来演示如何使用内置方法定义向量类型的变量,具体如下所示:
>>>import theano >>>import theano.tensor as T >>>x = T.vector(name = '变量名称',dtype = '该实例化的符号变量的数据类型')
其中,vector()函数需要指定以下两个参数:
· name——指定变量的名称。
· dtype——指定变量的数据类型。目前Theano变量支持的数据类型有8种:int8、int16、int32、int64、float32、float64、complex64、complex128。
在创建其他类型的变量时,将vector替换成对应的变量类型即可,比如通过将vector替换成matrix即可创建矩阵类型的变量:T.matrix。
表2.1列出了常见的符号类型以及符号变量的数据类型。
表2.1 常见的符号类型
续表
表2.1的第一列是符号变量的类型,第二列是符号变量的数据类型,最后一列broadcastable属性的作用是表示不同维度的矩阵之间是否可以广播。
上述使用Theano内置的变量定义方法,只适用于处理四维以下的变量,当需要处理更高维的数据时,需要采用自定义变量类型的方法进行定义,自定义变量的一般形式如下所示:
>>>import theano >>>import theano.tensor as T >>>mytype = T.TensorType(dtype,broadcastable
使用上述TensorType函数进行自定义变量操作时,dtype和broadcastable是必须指定的参数。
· dtype:指定变量的数据类型。目前Theano变量支持的数据类型有8种:int8、int16、int32、int64、float32、float64、complex64、complex128。
· broadcastable:是一个由True或False值构成的布尔类型元组,元组的大小等于变量的维度大小,如果元组中的某一个值为True,则表示变量在对应的维度上的数据可以进行广播(broadcast),否则数据不能广播。
接下来分别演示几种常见的变量定义方法。
返回一个零维的numpy.ndarray:
>>>theano.tensor.scalar(name = None, dtype = config.floatX)
返回一个一维的numpy.ndarray:
>>>theano.tensor.vector(name = None, dtype = config.floatX)
返回一个二维的numpy.ndarray,但是行数保证是1:
>>>theano.tensor.row(name = None, dtype = config.floatX)
返回一个二维的numpy.ndarray,但是列数保证是1:
>>>theano.tensor.col(name = None, dtype = config.floatX)
返回一个二维的numpy.ndarray:
>>>theano.tensor.matrix(name = None, dtype = config.floatX)
返回一个三维的numpy.ndarray:
>>>theano.tensor.tensor3(name = None, dtype = config.floatX)
返回一个四维的numpy.ndarray:
>>>theano.tensor.tensor4(name = None, dtype = config.floatX)
如果想要创建一个非标准的类型的变量,就需要用到自定义的TensorType。这需要将dtype和broadcasting pattern传入声明函数中。
创建一个五维向量的代码如下所示。
dtensor5 = TensorType('float64',(False,)*5) x = dtensor5() z = dtensor5('z')
可以通过以下代码对已存在的类型进行重构。
my_dmatrix = TensorType('float64',(False,)*2) x = my_dmatrix() #定义一个矩阵变量 print my_dmatrix == dmatrix #输出为"True"
图2.11 广播的运算机制
TensorType函数有一个重要的参数broadcastable,该参数对变量是否可以进行广播产生影响。广播机制使得不同维度的张量进行加法或者乘法运算成为可能,它可以让程序直接执行异构数据间的运算操作,避开异构数据间运算时维度转换的过程。例如,将一个向量数据与一个高维矩阵相加,如果没有广播的机制,则需要先将低维的数据转换成高维数据才能进行相应的操作符运算。通过广播机制,标量可以直接与矩阵相加,向量可以直接和矩阵相加,标量可以直接和向量相加,广播的运算机制如图2.11所示。
图2.11演示了广播一个行矩阵的过程,其中,T和F分别表示True和False,表示广播沿着哪个维度进行。如果第二个参数是向量,那么它的维度为(2,),广播模式为(False,)。它将会自动向左展开,匹配矩阵的维度,最终得到维度为(1,2)和Boradcastable为(True,False)。
与numpy的广播机制不同,Theano需要知道哪些维度需要进行广播。当维度可以广播时,广播信息将会以变量的类型给出。
下面的代码演示了在向量和矩阵的加法运算过程中,行和列是如何进行广播的:
接下来通过TensorType方法创建一个五维张量类型,将其broadcastable设置成(False,)∗5。此时,通过自定义方法新使创建的变量在5个维度上都不再支持广播机制。
import theano import theano.tensor as T mytype = T.TensorType('float32',(False,)*5) data = mytype('x') data.type()
结果如下所示:
<TensorType(float32,5D)>
从结果可以看出,已经成功修改了所创建变量的属性,使其在5个维度上不再支持广播。