量化研究体系:以7大模块为核心
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 EDB数据下载案例

万得量化接口中还有一个十分重要的板块,那就是EDB经济数据库。EDB经济数据库比起高频数据库数据量很小,但是数据的条目众多,涵盖了中国宏观经济数据库、行业经济数据库、大宗商品经济数据库、世界宏观经济数据库等方面。我们以大宗商品数据库为例,介绍构建一个完整的EDB数据库需要的技术和方法。

首先,我们需要获得如图1.1所示目录。

在万得的大宗商品数据库中,所有的指标都是标准的四级目录结构。以图1.1中的“非金属建材”为例,它的二级目录有“上游”“中游”“下游”,三级目录有“原油价格”“石脑油价格”“乙烯价格”等。对比图1.2所示目录结构可知,图1.1中的文件名与万得客户端目录结构一一对应。

图1.1 大宗商品数据库的目录结构

图1.2 万得的大宗商品数据库

我们打开上述例子中的Excel表格,可以看到如图1.3所示的指标字段结构。第一行表头显示了“指标名称”“频率”“单位”“起始时间”“结束时间”“更新时间”“来源”“国家”“指标ID”9个字段。其中“指标名称”就是最终四级目录的叶节点。

图1.3 指标字段结构

如果想通过万得量化接口来下载叶节点的数据,则图1.3所示的Excel表格中的“指标ID”等字段就是必要的了,所以我们先在Matlab中编写一个脚本来遍历上述存储了大宗商品数据库的目录结构的Excel表格,从而获取下载字段。下面对程序进行详细介绍。

获取Excel表中的字段的代码如下,内容包括获取当前目录的所有Excel表格、删除非必要的行、取出所有的文件名、初始化存储字段的变量、循环遍历所有的Excel表格。

上述代码中有一个KillExcelPID函数,用来关闭Excel的残留进程,具体代码如下。

下面介绍的是调用万得EDB函数并保存下载数据的案例,代码如下。