1703559720
1703559721
CTCR:
1703559722
1703559723
我们曾经答应过统计专家,提供深入探讨该问题的机会。罗伯特,不妨由你开始吧。
1703559724
1703559725
培累提厄:
1703559726
1703559727
作为统计学家,我曾经担任通用电气研究员达10余年,我可以这么说,大多数交易者都犯了一项错误,忽略了自由度丧失的概念。系统每引进一项参数,便代表一种控制,它会限制结果的可信度。这并非说优化(例如,尝试3条移动平均线的所有组合)没有任何作用。但是,你的系统所使用的控制参数数目越多(例如,移动均线、止损位、市场区间、RSI、百分比、随机显著水平……),则未来的交易越不可能符合你测试的结果。
1703559728
1703559729
最佳的交易系统会使用极少的变量,顶多2~5种。进行测试的历史数据应该要有足够的长度,产生至少30笔的交易。这项数据来自抽样理论,30个样本才能趋于常态。假如有这样两套交易系统,一种使用2项参数,在模拟过程中,共产生30多笔交易,其总盈利为10000美元;另一种使用7项参数,其20笔交易的总盈利为1000000美元。我会偏爱前者。前套系统的未来可信度远较后者为高,因为它的样本比较大,控制较少或自由度损失最小。
1703559730
1703559731
你应该质疑自己所做的模拟结果。同样地,交易系统的推销员在广告中大肆吹嘘其短期的巨额盈利,你也应该加以质疑。
1703559732
1703559733
CTCR:
1703559734
1703559735
罗伯特,有关减少参数数目或者减少控制,你有何建议?
1703559736
1703559737
培累提厄:
1703559738
1703559739
我会开始检验我的每一项交易规则,判断是否有任何两项或更多项的参数可以解释同一现象。如果两项参数的功能相互重叠,则同时使用两者或许可以改善模拟的结果,但该模型的可信水平与预测能力会降低。
1703559740
1703559741
举例而言,如果可变参数中包含成交量与价格区间,而成交量与价格区间之间存在着很高的相关性,则你已经用掉了两个自由度,而原本只需要消耗一个自由度便可以的。你应该选择表现最佳的一个变数,而舍弃另一个变数。
1703559742
1703559743
另一个减少使用者控制的好地方是进场点。不论你以开盘、收盘或盘中价进场,其实无关紧要。让系统使用者有机会就此做出选择,这只是延长电脑的运算时间,对结果并没有太大的影响。
1703559744
1703559745
凯利:
1703559746
1703559747
关于历史测试需要足够长度的时间段,我赞同罗伯特的观点。他这么说并非仅仅为了促销“商品系统公司”的数据,我建议至少使用5年的时间段口。
1703559748
1703559749
然而,我不同意他在某些方面的看法。第一,在模拟中引入另一个变量造成自由度的丧失固然是事实,但仅当数据点很少的时候才是如此。如果我们根据1000个数据点(大约为5年)进行模拟,则额外增加一项参数所造成的影响微乎其微。因此,我认为在模型内应该尽可能纳入较多的参数,只要每项参数都能够提供新信息便可以了。如果应该使用较少的参数,则“大通计量经济”(Chase Econometrics)的人便不会在其计量经济模型中纳入数百项变数了。
1703559750
1703559751
我强烈反对另一项观点:任何系统不论以开盘价、收盘价或盘中价进场,均无关紧要。根据常识判断,进、离场的选择会严重影响一套交易系统的绩效。
1703559752
1703559753
培累提厄:
1703559754
1703559755
我十分熟悉“大通计量经济”,因为我也进行过类似的工作。在商品交易者与大通的公式之间,存在着一项差异。典型的商品交易者仅观察过去的价格,少数人会加上成交量与未平仓合约数。大通则观察利率、货车装载量、赋税水平、国际收支、GNP、失业率、能源价格、外汇币值、原料价格……我希望大通的人有足够的判断力去验证所有输入的变量相互间不存在高度相关性。使用许多独立的基本面因素来预测未来的经济活动,以及根据商品过去价格来预测其未来走势,两者之间有很大的差异。我们商品交易者虽然没有很多数据可供运用,但也没有必要制造一些多余的参数以改善模拟的成果。
1703559756
1703559757
霍夫曼:
1703559758
1703559759
使用显著水平(significance level)这一统计学概念,可以判断过去数据模拟结果与未来的实际交易绩效之间的相关性。在我看来,整个问题类似于通过测试某随机变量过去的数据,来评估其未来的绩效。举例而言,某位工程师对一种合金材料进行抗拉强度测试,以决定其在特殊用途中的适用性。在每个测试样本中,所测量的强度都会有所不同,但根据过去的经验,该工程师能够评估其设计的未来绩效。更进一步,他能够估计失败的概率。任何桥梁崩塌的概率虽然很小,但它仍然是一项大于零的数值。在架设桥梁之前,这项概率能够也必须加以估计。桥梁可以如同商品交易方法,悬挂一个牌子,上面写道:“过去的测试并不保证未来的稳固。”
1703559760
1703559761
我并非想要暗示商品交易必须达到架设桥梁所需要的显著水平。但我的确认为,用随机变量的过去数据进行测试并将其未来绩效予以数量化不是个崭新的概念,此外,我认为交易者应该应用这些其他领域发展出来的预测技术来评估商品交易方法。
1703559762
1703559763
人们或许会辩称,材料的物理属性不会随时间改变,而期货市场却在不断地变化。如果情况真是如此,则所有的商品系统交易者都在自欺欺人。系统交易者的目标应该是寻找与利用那些不会变化的市场特性。辨认它们的最佳工具便是显著水平。
1703559764
1703559765
所谓显著水平,是指结果不会因为纯粹巧合而重现的概率。如果系统的显著水平很低,比如为10%,这意味着你的系统绩效有90%的概率会如同投射飞镖或扔掷硬币所产生的结果。这显然不是一套好系统。如果系统的显著水平为50%,这意味你以扔掷硬币的方式来决定买卖,其绩效有50%的机会类似该系统。这仍然不是一套有价值的系统。显著水平接近100%时,该系统在未来交易中出现良好绩效的可能性便越来越高。
1703559766
1703559767
以一套数学公式计算简单的显著水平或许有助于阐明我的观点。为了估计显著水平,我需要两项参数。第1项参数衡量系统的实际绩效。系统所产生的总盈利是随机变量的单一样本,因此未提供任何有关可变性的资讯,而可变性则是判断未来绩效的关键因子。就其本身而言,总盈利对方法评估的价值有限,其他的评估系统例如最大资金回撤、最大连续亏损、最佳与最差交易……也会受到同样的批评。为了克服这个问题,某些人使用夏普比率,它是以每年的平均回报率除以其标准差。它能够稍做调整以适应不同的时间段。我偏爱使用每笔交易平均盈利除以其标准差。让我们称之为绩效比率。
1703559768
1703559769
第2项参数是自由度的数目。它等于系统在测试时间段内所产生的交易笔数减去该系统所使用的限制的个数。自由度的数目很重要,因为它可以揭示系统的曲线匹配性质。拥有许多规则、参数与例外的系统对于过去的数据通常都能够获得良好效果,但应用于未来的实际交易时却经常会失败。其所以失败的理由在于规则是根据过去的数据而设定的。如果你给我一组来自于“随机漫步”市场的数据,我可以针对该市场设定100条规则,并产生连续100笔的盈利交易。该系统会具有绝佳的夏普比率与绩效比率,但因为其自由度很低,所以其显著水平也会很低。
[
上一页 ]
[ :1.70355972e+09 ]
[
下一页 ]