1700511066
1700511067
1700511068
1700511069
图18-22 20轮训练
1700511070
1700511071
纵轴表示训练集中的类别标示,横轴表示实际预测时得到的类别标识。这样,每个单元格的含义就很明确了。以纵轴为“2”、横轴为“1”的5092这个单元格为例,表示有5092个原本被标记为“2”类在模型做判断的过程中被判断为“1”类的误判情况。而横轴为“1”、纵轴为“1”的“1305778”的含义是,有1305778个样本应为“1”类,并被判断为“1”类,属于正确识别的情况。理论上讲,应该是对角线上深色单元格中的数值越大越好。在这个模型中,经过20轮迭代后,判断正确的样本数量为1334688个,只占约38%。在这个阶段,可以通过增大轮数让算法继续收敛。
1700511072
1700511073
为了让收敛速度加快,可以使用ReLU作为激励函数。修改这个部分。
1700511074
1700511075
model=Sequential()model.add(Dense(120, input_dim=63))model.add(Activation(‘relu’))model.add(Dense(80, input_dim=100))model.add(Activation(‘relu’))model.add(Dense(60, input_dim=70))model.add(Activation(‘relu’))model.add(Dense(50, input_dim=120))model.add(Activation(‘relu’))model.add(Dense(40, input_dim=50))model.add(Activation(‘relu’))model.add(Dense(30, input_dim=40))model.add(Activation(‘relu’))model.add(Dense(12, input_dim=30))model.add(Activation(‘softmax’))
1700511076
1700511077
将训练的轮数变为150轮,并将验证集比例调整到35%。
1700511078
1700511079
model.fit(X_train, y_train, nb_epoch=150, batch_size=2000, validation_split=0.35)
1700511080
1700511081
在训练结束后,处理一下输出数据,如图18-23所示。
1700511082
1700511083
1700511084
1700511085
1700511086
图18-23 150轮训练
1700511087
1700511088
这次训练的数据变化很明显。在这个模型中,从模型标记的角度来看,应该是“0”和“1”以外的类别识别正确率越高越好。尽管结果还是很不理想,但比只进行20轮训练时已经有了进步,熵减的方向没错——让分类结果向对角线集中。
1700511089
1700511090
4.未尽步骤
1700511091
1700511092
在这个实践中仍有一些步骤没有进行,这也是沿着数据科学的试探步骤逐步深入的过程。
1700511093
1700511094
(1)引入更多的维度对这个模型进行改进。如果是基于压力均线的理论,还需要引入更久以前的数据,而不只是前15分钟的数据。此外,可以尝试采取其他分类方式或者引入特征值。例如,可以尝试使用其他分类的分界点,分界点的位置和分类的类别数量一定会影响分类效果,在刚刚的第3次尝试中,我们已经看到了实例。对于特征值的引入,例如我们在第2次尝试中加入的“小时”、“周”、“月”3个特征,虽然没有看到明显的效果,但仍然可以继续尝试,甚至尝试引入其他相关指标。
1700511095
1700511096
(2)尝试调整不同周期的观察尺度。理论上说,建议缩短观察周期,如果能拿到秒级的数据,就可以通过尝试观察1分钟之内的变化及未来1分钟之内的波幅来做分类。交易高频化应该是自动交易的趋势,毕竟高频的交易容易产生快速验证,而且也能发挥短时交易中机器在下单与平仓方面的效率优势。
1700511097
1700511098
(3)在模型训练基本成熟之后,就可以考虑在MT4平台上用MQL语言编写脚本,进行历史数据回测。在历史数据回测基本满足要求之后,就可以考虑在虚拟仓上进行交易。如果仍然没有发现问题,就可以考虑进行实仓交易了。对每一单交易,都要根据历史K线统计数据,设置相对较低的止盈和止损位置。
1700511099
1700511100
(4)为了降低真实交易的风险,还要考虑在多平台、多个货币对上分别训练模型。将大额资金投入分摊到多个平台、多个货币对的交易中去,以降低平台级风险及由单个货币对产生的波动风险。
1700511101
1700511102
在自动交易系统的研究路上,还有很多需要讨论的内容。例如,新闻中的文字和走势的关系也可以通过相应的算法引入模型,对模型分类的准确性进行提升。
1700511103
1700511105
18.1.11 小结
1700511106
1700511107
K线图的分析方法其实很多,而且K线图不仅可以像刚刚这样通过形态方式来分析,也可以结合任何其他维度来分析。数据科学的魅力就在这里——既然是一种可以被人们掌握的学科,就存在方法论,只要按照这样的方法论用科学的方法逐步验证,几乎任何问题都可以产生数字性描述。
1700511108
1700511109
到现在为止,所有单凭K线图无法准确预测市场价格的情况在我看来都是由于参与计算的维度不足导致的,而这些维度的参与本身所要花费的成本又相当高。这应该就是大量热衷中长期交易的人及投资家喜欢根据局势和大的市场环境来配置多头和空头的重要原因。
1700511110
1700511111
作为一个带有学术性的问题,对K线图的研究可以不计成本地、无限地扩展下去。不过,如果是专业的投资人士或者寻求中长期稳定收益的人士,还是要多去关注各国比较重要的经济新闻,尤其是各国央行对本国货币的态度,以及各国之间的贸易动态。通常在这个层面产生的对货币、黄金、股票价格的影响,其幅度、周期,以及影响的确定性和稳定性,都比单纯对K线图的分析要准确得多。
1700511112
1700511113
1700511114
1700511115
[
上一页 ]
[ :1.700511066e+09 ]
[
下一页 ]