上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
0.1.1 数据库
数据库是需要研究者根据自身的研究发展不断新增构建和持续更新的资源模块。目前本书的数据库主要基于万得量化接口,部分基于同花顺量化接口,还有一部分来自网络数据的抓取。多元化的数据来源有助于提升我们数据库的生态性、多样性、稳定性。而作为量化研究的主要研究对象,数据的存储方式和结构直接决定了取用时的方式和方法,所以如何设计数据库结构也是一个大问题。本书的基础篇基于MySQL和MongoDB建立数据库,也会介绍MySQL和PyMongo的基本语法。对于非立志于成为一个专业DBA(数据库分析师)的研究者来说,本书介绍的数据库知识足够一个量化分析师的研究使用了。
在数据的结构与层次分类上,如果根据大类资产的分类进行划分,主要分为股票、期货、期权、利率、宏观;如果根据数据加工的深度和广度划分,可以分为行情数据、衍生数据、多维深度数据;根据数据的频率划分,可以分为年频率、月频率、周频率、日频率、时频率、分钟频率、秒频率、tick频率;根据数据的内容性质划分,可以分为结构化数据、非结构化数据;其他还有诸多的分类方法,如分为基本面数据和行情数据、交易数据与非交易数据、内部数据和公开数据,等等。
一个合理的数据库目录结构可以这样设计: