量化研究体系:以7大模块为核心
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 数据库

本章介绍的数据库主要基于MySQL,用于存储结构化数据。在本书的体系中,我们将“普通数据库”的结构划分为以下形式:首先,划分为高频数据、非高频数据,高频数据主要有两个类别,分别是期货高频数据和股票高频数据,非高频数据分为股票、期货、期权、基金、混合数据集,其中混合数据集主要指数据量不大、类别丰富,但是每一条或每几条可以单独使用的数据;其次,非高频数据还可以进一步划分为行情交易类数据和非行情交易类数据,比如股票融资融券数据就是行情交易类数据,股票评级数据就是非行情交易类数据。

总体来说,“普通数据库”可以总结为如表1.1所示。

表1.1 “普通数据库”结构

续表

除“普通数据库”外,我们还建立了“深度数据库”,包含股票、基金、宏观、舆情等多个板块的多维数据。具体如表1.2所示。

表1.2 “深度数据库”结构

续表

续表

“普通数据库”主要基于万得量化接口与MySQL数据库技术,编写了全套Matlab程序用以自动化存储、维护、更新、使用数据库,时间长度最早从2000-01-04开始。“深度数据库”包含了时间长度不等的各个表,最早的一些表比如技术指标从证券交易所成立之初就有数据。下面的章节,我们以“普通数据库”为例,讲解数据库自动更新程序的开发和设计。