要选择的测试数据的周期是另一个常常被忽视的重要方面。从最低要求来看,测试周期应长得足以在每个市场上至少产生30笔交易。少于30笔交易就违反了一个基本的取样理论,即一个数据组至少要有30个数据点,才能说明是正态分布。注意这里所指的不是数据的天数、周数或月份数,而是指实际的交易。从统计学的角度而言,少于30笔交易,产生的结果就不可靠。交易笔数大于30的程度越多,测试越可靠。
同样重要的是,你所测试的市场周期段中包含的每种市场情况必须有尽可能多的出现频率。定义的可能的市场情况包括上升、下降及横向(尽管这是主观的看法)趋势;你的研究周期包含的每种情况要尽可能多。目的是要通过尽可能多地涵盖过去的情况来模拟将来可能出现的情况。如果只进行几年的度量可能会产生问题。比如,自从引进股指期货后,股市就未出现过严重的走跌阶段,所以用这个时期的数据测试往往会对偏向行情看涨的系统有利。股指期货市场的整个存在时期并没有包含真正足够多的数据,不足以反映潜在的未来市场情况。然而,石油期货,也许可以指望它来产生一个更健全的交易系统。换句话说,在原油市场进行的短时间周期测试结果可能比在股指期货市场进行的长时间周期测试结果更真实,因为到目前为止,股指数据有明显的上升偏向。如果在股指期货市场上使用只买进系统,其结果可能比使用只卖出系统的好得多。正如俞吉•贝拉(Yogi Berra)曾言,未来不同于过去。
有这样一种有趣的推论:尽管一个系统有时看上去很具诱惑性,但它永远都不应该偏向市场的某一方。显然,股指期货的大部分利润会流进多头方的口袋,显著的例外很少。这并不意味着交易系统就应该偏向市场的多头方。系统对市场的任何一方都不应该有意见或偏袒。如果这似乎很明显,回想一下20世纪70年代的情况吧。当时商品市场的大部分利润都被多头方赚走了。那个时期设计的交易系统也变得主要是牛市系统。那个时期改善交易结果最简单的方法是限制或消除做空销售。我们怀疑这种行情看涨的偏向是20世纪80年代初许多商品交易顾问业绩糟糕的主要原因。
我们的结论是:没有固定的定义说明一个测试应该包括多少数据。假设一般的顺势系统一个月在每个市场交易一次,那么至少要进行三年的测试,至少对于一个要产生之前提到的30笔交易的最小值的初始测试而言,需要三年的测试。然后再花两年或更久做进一步的测试(我们稍后会解释这样做的原因),所以总共是五年,这只是个巧合,五年是一般认可的最小周期。倘若在测试期间,市场只是一面性或两面性,你还得延迟测试时间。你会想尽力在研究中包括最多的不同的市场情况的。
我们喜欢用很多数据,喜欢测试不同的时间周期。除非你这么做过,否则你永远不会完全领会到盈利的交易系统是多么难以捉摸以及测试结果对时间的依赖性有多大。对于那些没有经历过能反映典型的市场情况的时间周期测试的系统,我们要格外小心。
请注意下表中(见图3-1)改变时间框架如何影响着结果,尤其是与亏损相关的结果。收益很相似,会产生一个有趣的点。我们所见过的几乎所有的最优化处理/测试程序把总收益作为选择随后的测试或现时交易中要用的最佳参数的唯一标准。在我们的简单例子中,各个收益似乎一致。然而,亏损却大不相同。有多少交易商愿意在承受一万美元的亏损的同时去交易一份仅有约两千五百美元的平均利润的合约?这一问题引人深思。
图3-1
图3-1中的例子阐释了关于测试(总体上)及优化处理(具体)很少提到的危险之一。当你只为一个结果(通常是总收益)测试时,你可能忽略了其它同等重要的数据。我们建议你为多种属性测试,而不是仅仅为了一种属性测试。我们了解这会使过程更复杂,还可能从多方面使其主观化,但只为总收益测试常常具有误导性,对你的经济安全也有害。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。