打字猴:1.70051089e+09
1700510890 #!/usr/bin/pythonimport os,sys,MySQLdb    try db=MySQLdb.connect(host=‘localhost’, user=‘root’, passwd=‘111111’, db=‘FOREX’)      cursor=db.cursor()  counter=0  cursor.execute(‘USE FOREX;’)  sql=‘SELECT * FROM EURUSD_1M’  cursor.execute(sql);  result=cursor.fetchall()    for i in range(0, cursor.rowcount):    startdt=str(result[i][0])    startpip=str(result[i][4])    cursor1=db.cursor()    cursor1.execute(‘USE FOREX;’)    sql1=‘INSERT INTO SLIDEWINDOW SELECT DT, MAX(HIGH)-‘ + startpip + ‘ AS RISE_PIP, ‘ + startpip + ‘-MIN(LOW)AS FALL_PIP, CASE WHEN ‘+ startpip + ‘<>MIN(LOW)THEN(MAX(HIGH)-‘ + startpip + ‘)/(‘ + startpip + ‘-MIN(LOW))ELSE(MAX(HIGH)-‘ + startpip + ‘)/0.0001 END FROM EURUSD_1M WHERE DT BETWEEN ”’ + startdt + ’” AND DATE_ADD(”’ + startdt + ’”, INTERVAL 60 MINUTE)’    cursor1.execute(sql1)        if i%2000==0:      db.commit()  db.commit()except MySQLdb.Error,e print “Error %s” %(str(e.args[0])+’:’+str(e.args[1]))  exit(1)cursor1.close()cursor.close()db.close()
1700510891
1700510892 使用SQL语句,计算涨幅与跌幅波动比大于1.5且涨幅大于10个点的分钟数。
1700510893
1700510894 SELECT   COUNT(*)FROM   SLIDEWINDOWWHERE   PROPORTION>=1.5 AND RISE_PIP>=0.0010;
1700510895
1700510896
1700510897 共找到1606759分钟的数据,占5447760分钟记录的29.5%,说起来不算太差。在这种情况下,理论上有超过的时间可以下单买涨。
1700510898
1700510899 下面计算一下涨幅与跌幅波动比小于0.66且跌幅大于10个点的分钟数。
1700510900
1700510901 SELECT   COUNT(*)FROM   SLIDEWINDOWWHERE   PROPORTION<=0.66 AND FALL_PIP>=0.0010;
1700510902
1700510903 共找到1576827分钟的数据,占5447760分钟记录的28.9%,与涨势的情况相差无几。
1700510904
1700510905 下面我们找出这些点前面的1M K线图数据,并尝试设计一个分类模型。
1700510906
1700510907 构造训练样本
1700510908
1700510909 为了方便训练,我们先构建一个便于生成训练样本的表或者文件。在Keras里,训练样本和验证集是以如下这种文本形式出现的。
1700510910
1700510911 [[ 0.48797666  0.49515848  0.96743517 …,  0.34333791  0.01071582   0.55347333] [ 0.18182799  0.52856064  0.7593987  …,  0.93302057  0.96330937   0.36177566] [ 0.29722546  0.69625588  0.02873254 …,  0.48557884  0.73657364   0.32492677] …, [ 0.13549382  0.00378319  0.06903272 …,  0.27581255  0.00568914   0.32686159] [ 0.24844718  0.8345029   0.63331516 …,  0.15998351  0.56751348   0.09996194] [ 0.33877344  0.37488438  0.42507674 …,  0.44084842  0.18272158   0.70054914]][[0 0 0 …, 0 0 0] [0 0 0 …, 0 0 0] [0 0 0 …, 0 0 0] …, [0 0 0 …, 0 0 0] [0 0 0 …, 0 0 0] [0 0 0 …, 0 0 0]]
1700510912
1700510913 前半部分最外层的方括号中是一个个输入向量,用方括号括起来,中间的维度用空格分开。后半部分的分类向量信息,最外层用方括号括起来,每一个分类向量也用方括号隔离。在这里,由于使用Softmax作为输出层,所以每一个输出向量的每一个维度都是一个分类概率。
1700510914
1700510915 使用SQL语句建造一个训练表,这个表中既要包含刚刚所有的EURUSD表中的信息,也要包括SLIDEWINDOW表中的信息。
1700510916
1700510917 CREATE TABLE EURUSD_TRAININGSELECT   EURUSD_1M.DT,   OPEN,   HIGH,   LOW,   CLOSE,   RISE_PIP,   FALL_PIP,   PROPORTIONFROM   EURUSDINNER JOIN   SLIDEWINDOWON   EURUSD_1M.DT=SLIDEWINDOW.DT;
1700510918
1700510919 此外,还要给每条训练记录加上一个分类,就是我们前面提到的RISE3、RISE2、RISE1、NONE、FALL1、FALL2、FALL3这几个分类。为了方便起见,最后在向量构成时会把它们对应地改写成1、2、3、4、5、6、7这样7个分类。在此之前,改造一下EURUSD_TRAINING表,给它加上一个CLASSIFICATION字段。
1700510920
1700510921 ALTER TABLE EURUSD_TRAINING ADD COLUMN(CLASSIFICATION INT);
1700510922
1700510923 在表构造环节的最后,要加上分类条件。
1700510924
1700510925 UPDATE EURUSD_TRAININGSET CLASSIFICATION=1WHERE RISE_PIP>=0.0040 AND PROPORTION>=1.5;UPDATE EURUSD_TRAININGSET CLASSIFICATION=2WHERE RISE_PIP>=0.0020 AND RISE_PIP<0.0040 AND PROPORTION>=1.5;UPDATE EURUSD_TRAININGSET CLASSIFICATION=3WHERE RISE_PIP>=0.0010 AND RISE_PIP<0.0020 AND PROPORTION>=1.5;UPDATE EURUSD_TRAININGSET CLASSIFICATION=5WHERE FALL_PIP>=0.0010 AND FALL_PIP<0.0020 AND PROPORTION<0.67;UPDATE EURUSD_TRAININGSET CLASSIFICATION=6WHERE FALL_PIP>=0.0020 AND FALL_PIP<0.0040 AND PROPORTION<0.67;UPDATE EURUSD_TRAININGSET CLASSIFICATION=7WHERE FALL_PIP>=0.0040 AND PROPORTION>=1.5 AND PROPORTION<0.67;UPDATE EURUSD_TRAININGSETCLASSIFICATION=4WHERE CLASSIFICATION IS NULL;COMMIT;
1700510926
1700510927 这里要注意最后一个分类,其他几个分类的定义都比较清晰。最后一个分类其实并不仅仅是波动小的分类,还包括一些情况,例如上下波幅可能很大但涨跌幅度相当。这两种分类合起来作为分类“4”,我们将它们统称为“不适合入场”就好了。
1700510928
1700510929 编写训练脚本
1700510930
1700510931 在滑动窗口捕捉到涨跌信息后,可以对应输出数据分类。由于数据量比较充足,可以考虑用70%的数据作为训练数据,留下30%的数据作为验证数据。
1700510932
1700510933 使用Keras和Theano搭建一个训练环境,并选择相应的数据项作为训练集和验证集。在这个训练过程中,我们假设从当前的时间点向前观察60分钟,结合当前时间点的“蜡烛”位置来判断是否产生了“突破”形态,并使之向着自己想定的方向移动,即今后1小时的涨势信息蕴含在之前60分钟K线图每根“蜡烛”所表示的价位之中。
1700510934
1700510935 在做这部分工作之前,我们处理一下EURUSD_TRAINING表,为其添加一个索引。
1700510936
1700510937 ALTER TABLE EURUSD_TRAINING ADD INDEX(DT);
1700510938
1700510939 在这里请注意,可以直接在数据库里用游标做滑动窗口构造训练样本集。这种情况下,时间复杂度在O(n)上。但是,不推荐在遍历中嵌套一个60分钟的请求——尽管时间复杂度理论上还是O(n),不过由于每次都要再请求数据库,所以消耗的时间很长。在这里我使用的方法是将数据输出到文本文件,然后用遍历文本文件的方式进行构造。
[ 上一页 ]  [ :1.70051089e+09 ]  [ 下一页 ]