用频数分布汇总数据(2)

2013-10-19 19:11:54

  正如上述步骤所明确表述的,一个频数分布将数据归入到一系列区间之中。(区间有时也被称为组别(classes)、范围(ranges)或者箱体(bins)。)一个区间(interval)是指一对数值,在这对数值的范围之内会包含落入其中的观测值。每个观测值只会落入一个区间之中,并且整个区间应该包含数据中所有观测值。实际落入一个给定区间的观测值数量被称为绝对频数(absolutefrequency),或者简称为频数。频数分布是反映一组区间以及各个区间相对应的频数度量指标的一个列表。

  为了说明操作的基本步骤,假设我们有12个观测值,以升序排列为:-4.57,-4.04,-1.64,0.28,1.34,2.35,2.38,4.28,4.42,4.68,7.16和11.43。最小的观测值为-4.57,而最大的观测值为+11.43,因此,极差为+11.43-(-4.57)=16。如果我们设定k=4,那么区间宽度为16/4=4。

  因此,所得到的区间分别为[-4.57,-0.57),[-0.57,3.43),[3.43,7.43)和[7.43,11.43)。([-4.57,-0.57)的记法是指-4.57≤观测值<-0.57。在文中,方括号表示该端点包含在区间内。)

  在实务中,我们可能想要将上述的基本步骤加以简化。例如,我们可能为了解释方便,想让区间以整数开始与结束。另外,我们也需要对区间数k的选择予以解释。我们将在对于标准普尔500数据建立频数分布的过程中,对于这些问题进行讨论。

  注:这里的区间之间不会相互重叠,所以每个观测值只能唯一地落入其中的某一区间之中。

  我们首先讨论如何对1926~2002年区间段的标准普尔500年收益率建立频数分布。在这个区间中,标准普尔500收益率的最小值为-43.34%(在1931年),最大值为+51.99%(在1933年)。因此,该数据的极差近似为+54%-(-43%)=97%。现在的问题是我们用来归类观测值的区间数k应该选择多少。虽然在统计学的文献中有一些对于k选择的建议,但是设置一个有用的k值经常涉及对于数据仔细的观察与审慎的判断。那么我们应该要包含多少具体细节呢?如果我们使用过少的区间,那么我们将汇总得过于粗略,从而失去数据相关的特征。而如果我们使用过多的区间,那么我们可能根本就没有起到汇总的效果。

  我们可以通过比较划分不同区间宽度所产生的效果,来选择一个适当的k值。大量的空白区间可能意味着我们过分想要将数据进行分类,以至于反映了过多的细节。我们可以从一个相对较小的区间宽度开始着手,来观察它是否使得大部分区间是空白的,以及判断与区间宽度相关的k值是否取得过大。如果区间大部分都是空白的或者k值非常大,那么我们可以考虑逐步增大区间宽度(减小k值),直至产生一个能有效汇总数据分布的频数分布。对于标准普尔500年度序列来说,1%的收益率区间宽度将形成97个区间,并且其中很多区间是空白的,因为我们只有77个年度观测值。我们需要记住建立频数分布的目的在于汇总数据。假如为了解释简单,我们想要使用以整数而不是分数百分比表述的区间宽度。一个2%的区间宽度可能会比1%的区间宽度拥有更少的空白区间,并且能更有效地汇总数据。一个2%的区间宽度将会有97/2=48.5个区间,我们可以将其四舍五入成49个区间。总区间的宽度将为2%×49=98%。我们可以肯定,如果我们从最小的整数-44%开始,不断增加2%的区间,最终区间的端点将位于-44.0%+98%=54%,该区间就包含了样本中最大的收益率53.99%。在通过这种方式建立该频数分布过程中,我们也得到以数值0%结束和以0%开始的两个区间,这样就使得我们可以计算数据中负的和正的收益率的数量。不需要太多的工作量,我们就找到了汇总数据的有效方法。我们将使用2%的区间,从-44%≤Rt<-42%开始(在表中给出的是"-44.0%到-42.0%")一直到52%≤Rt≤54%结束。

  注:每个区间的下限取的是不严格不等号(≤),而每个区间的上限取的是严格不等号(<)。

  资料来源:由伊博森协会EnCorrAnalyzec产生的频数分布。

  相对频数的定义。相对频数(relativefrequency)是指每个区间的绝对频数除以整个样本观测值的数量。

本文摘自《定量投资分析》


   作为CFA协会投资学系列丛书中的一本,无论是关注金融的学生,还是从事投?的业界人士,《定量投资分析》(原书第2版)适合每一位对该领域有兴趣的读者。本书所介绍的全球通用的准则将帮助你理解定量投资方法,并将这些方法应用到当今的投资过程中。

 承诺与声明

兄弟财经是全球历史最悠久,信誉最好的外汇返佣代理。多年来兄弟财经兢兢业业,稳定发展,获得了全球各地投资者的青睐与信任。历经十余年的积淀,打造了我们在业内良好的品牌信誉。

本文所含内容及观点仅为一般信息,并无任何意图被视为买卖任何货币或差价合约的建议或请求。文中所含内容及观点均可能在不被通知的情况下更改。本文并未考 虑任何特定用户的特定投资目标、财务状况和需求。任何引用历史价格波动或价位水平的信息均基于我们的分析,并不表示或证明此类波动或价位水平有可能在未来 重新发生。本文所载信息之来源虽被认为可靠,但作者不保证它的准确性和完整性,同时作者也不对任何可能因参考本文内容及观点而产生的任何直接或间接的损失承担责任。

外汇和其他产品保证金交易存在高风险,不适合所有投资者。亏损可能超出您的账户注资。增大杠杆意味着增加风险。在决定交易外汇之前,您需仔细考虑您的财务目标、经验水平和风险承受能力。文中所含任何意见、新闻、研究、分析、报价或其他信息等都仅 作与本文所含主题相关的一般类信息.

同时, 兄弟财经不提供任何投资、法律或税务的建议。您需向合适的顾问征询所有关于投资、法律或税务方面的事宜。