首页 百科知识 现存统计数据分析

现存统计数据分析

时间:2022-06-20 百科知识 版权反馈
【摘要】:二、现存统计数据分析现存统计数字可来自多方面。下面通过两项研究来说明现存统计资料研究方法。杜尔克姆从现存统计资料中形成上述“自杀是社会不稳定和不和谐产物”的假设。杜尔克姆这本经典的社会科学研究著作内容丰硕,上面只是很肤浅的介绍,旨在说明政府和信息机构的现存统计数据可以是提出假设和进行验证的源头,利用它有可能做出很好的研究工作。

二、现存统计数据分析

现存统计数字可来自多方面。第一,研究报告,例如一些管理、经济社会研究组织发表的各种研究报告,提供大量数据可供其他研究课题重新分析或称二次分析(secondary analysis)之用;第二,官方统计资料,包括全国人口、工业普查资料,国家统计部门、各级政府部门和各种专业机构编制的供公众应用的年鉴、报告、报表等;第三,信息调查研究机构和咨询公司的数据库。由于计算机的发展和应用,这类经营数据和信息的企业日益增多。在美国等发达国家这三类数据的来源都较丰富,有许多机构、专业人员从事此项工作,而且检索、获取和使用各个环节运作规范,研究人员按需使用这些数据较方便。我国现在在数据来源和运用各环节还存在较大差距,应该说这是目前管理研究论文不够规范、高质量论文较少的一个重要原因。

现存统计资料研究方法和后面要提到的统计数据分析不同。前者属于为验证假设而观测和收集数据的一种方法,统计数据分析则是验证工作后期的数据处理和分析技术。现存统计资料研究方法的应用步骤也与文本分析类似,分为假设形成、变量提取和属性分类、数据分析和结果分析。下面通过两项研究来说明现存统计资料研究方法。

法国社会学家杜尔克姆(Enaile Durkheim)1897年成书的《自杀论》是社会科学形成的标志和实证研究的典范,同时也体现了现存统计资料分析研究的全过程。

先看此项研究的假设形成。关於自杀的原因,一般都从自杀者本人遭受到的不幸事件来解释,如失恋、破产、受辱或精神失常等。杜尔克姆通过阅读各种有关自杀的统计资料,发现各个国家的自杀率相对稳定,年复一年都几乎不变,然而却出现夏天炎热季节自杀率较高的现象。为此,他最初验证了气温和自杀率相关的假设,比较分析了不同纬度地区的自杀率。如果假设成立,欧洲南部各国气温较高,自杀率应比北部、中部各国要高。验证结果,西班牙、葡萄牙和意大利等气温较高的国家,自杀率却比法国要低,最高自杀率的国家纬度居中,说明气温并非自杀率变异的原因。

杜尔克姆继续探索其他与自杀率相关的因素,从统计数据看出,不同年龄段的自杀率不一样,性别上也有差距,男性自杀率比女性要高得多。然而,影响自杀率的原因究竟何在,直到从统计数据中发现这样的一个现象:1848年法国大革命时期自杀率显著增高。他才根据这个事实构思出初步因果关系假设,即“社会均衡的破坏可引起自杀”以及“社会的稳定与和谐可减少自杀”。

杜尔克姆将这个总假设细化并深入分析,发现各个国家的自杀率很不相同。例如萨克森(Saxony)比意大利的自杀率要高出10倍,而且按自杀率高低排序,各国相对名次长期不变。各国自杀率如何会这样有规律的差异,杜尔克姆发现了一种值得注意的现象,以基督教为主的国家自杀率总是比以天主教为主的国家要高,以基督教为主的国家自杀率为每百万人口190,基督教和天主教均衡的国家为96,而天主教为主的国家为58。

杜尔克姆验证了宗教因素和自杀率的关联,统计数据表明,德国的巴伐利亚州(Bavaria)是天主教人数最多而自杀率最低的地区,基督教居多数的普鲁士州(Prussia)自杀率要高得多。从巴伐利亚州和普鲁士州内部来看,基督教最多的省份,其自杀率也最高,见表4-3。

表4-3 自杀率数据分析

资料来源:引自参考文献[1]。

杜尔克姆确认宗教是影响自杀率的重要因素,并将此新发现和政治动乱时期自杀率上升的发现结合起来,从理论上抽象出更一般的结论:“自杀是反常‘normlessness’的产物”,即是说,自杀是社会不稳定和不和谐的产物。政治动荡时期,人们感到社会旧的框架已崩溃,失望和沉闷,自杀是一种解脱。如果社会稳定、和谐,意味着每个人感到整个社会人们相互依存和忍让,则起到防范自杀的作用。这也可以用来解释宗教的因素,基督教与天主教相比更强调个人独立和自由精神,容易陷入怀疑和孤独的境地,在政治动荡时,尤易走向极端。而天主教内部结构相对比较稳定,自杀率随之不同。

杜尔克姆从现存统计资料中形成上述“自杀是社会不稳定和不和谐产物”的假设。为了进一步验证,还需将此假设落实到变量层次。杜尔克姆抽取出“整合度”这个变量来反映社会稳定与和谐的程度,进而概括出操作层次的假设:“自杀率与个人所参与的社会集团的整合度成反比。”无论是家庭婚姻、宗教等因素对自杀率的影响,都可从整合度这个变量加以解释。

此项研究在自杀理论方面提出了创新的主题并加以验证。创新之处在于,提出了自杀的主要原因并非取决于个人的内在秉性,而取决于支配个人行为的外部环境及带有某种共性的社会思潮。社会势力、社会潮流将个人引向死亡。每个自杀的人似乎都是自己的主意,由个人自己作出的决策,实际上不过是集体力量的牺牲品。杜尔克姆这本经典的社会科学研究著作内容丰硕,上面只是很肤浅的介绍,旨在说明政府和信息机构的现存统计数据可以是提出假设和进行验证的源头,利用它有可能做出很好的研究工作。

“自杀是社会不稳定和不和谐的产物”这个假设,并非杜尔克姆以前别人从未想到过,即使现在,未读到过《自杀论》的人也会有此感觉。我国的历次政治运动中,特别是“文化大革命”时期,机关、学校的自杀率明显增多;而改革开放以来,特别是近十几年来自杀已是少见罕闻的事。研究工作的价值恰恰在于:许多人耳闻目睹甚至习以为常的现象,某个有心的研究者能把握住它所蕴含问题的分量和潜在的价值,把它作为研究主题提出来,并进行学术论证,用数据、事实和科学分析来说话,排除各种各样似是而非的理论解释。有时人们会感到社会科学和管理学科研究的结论近乎常识,读到这类研究文章,似乎自己也曾考虑过,和报纸媒体上的某些报道似乎也相差不远。然而,其中有个重大差别,即取得结论所用方法的差别。作为研究论文,要经过科学观测,严谨的论证、验证和探索,而一般新闻报道无需论证过程和提供论证所必需的各种证据。常识往往反映人们的智慧,但缺乏清晰概念的描述,不去追究内在的深层因素及其间的关联。

研究方法论所提出的一些基本概念,在具体研究问题时有不同的运用,这里介绍《自杀论》研究对“分析单位”和“效度”问题的处理。先看分析单位。杜尔克姆的自杀研究中,现存资料的分析单位并非是个人而是群体,像上面提到的政治地理单位包括:国家、区域、州和城市等。现存统计数据的集结单位往往和研究所需分析单位不一致。例如,杜尔克姆企图辨析天主教和基督教成员自杀率的差异,但现存统计数据中找不到按宗教来分类的自杀率数据。虽然,最后从基督教国家、区域和州的自杀率较高推断出基督教成员自杀率较高的结论,但这种结论并非严密无瑕,因为群体的行为并不完全反映个人行为。例如,在基督教为主的区域内,天主教成员可能更容易失望和孤独而导致自杀,甚至不能排除基督教为主的高自杀率区域倒没有任何基督教成员自杀。这就是“分析单位”更换而引起的“生态误区”(ecological fallacy)。杜尔克姆为了避免此陷阱,从两方面着手,一方面在依靠经验事实推论的同时进行严格的理论演绎,理论和事实互补以避免得出矛盾的结论。另一方面,从其他视角和层次来反复验证假设。验证结果,基督教为主的国家自杀率比天主教为主的国家自杀率要高,天主教国家内基督教区域比基督教国家内天主教区域的自杀率要高,等等。这一系列假设都得到证实,增添了证据,支持“基督教成员比天主教成员自杀率较高”的假设。

再看效度问题。现存数据分析意味着研究者只能有什么数据分析什么数据,而不能完全根据研究者的兴趣和需求来提供数据,根据这些数据得出的变量属性值并不一定能反映研究者原本期望得出的结果。科学方法的两个特征可用来改善效度。一是逻辑推理,如上述杜尔克姆知道收集不到自杀者的宗教归属的资料,用基督教为主的地区自杀率高的数据来推论基督教地区自杀率较高,存在逻辑上的漏洞。因此,杜尔克姆进一步从不同视角和层次寻找证据填补漏洞,完善逻辑推理链。另一是重复验证。为了验证气候影响自杀率这个假设,重复验证了不同纬度地区的自杀率,同一国家不同地区以及不同国家在不同季节的自杀率等,最后得出自杀率差别不能用气候差异来解释的结论。

现在介绍前面曾提到的,利用现存统计资料进行的一项题为“新兴市场的股票价格为何同步涨落”的研究,刊登在期刊“The Journal of Financial Economics”上。来自中国的加拿大博士研究生发现上海股市价格要涨大部分都涨,要跌大部分都跌,并告诉指导教授这种现象,这位教授难以置信,再核实统计数据,果真如此,于是就抓住这个“异常”现象去探索其中隐含的机理和规律。最初提出了多种假设,有的通过统计数据分析不成立而放弃,摒弃一些假设亦可看作从相反的角度来论证主题的成立。有两个假设在后续的实证分析中得到证实:①人均GDP较高的国家股票价格变化的同步性较弱,而人均GDP较低的国家则出现较强的涨落同步现象;②美国股票市场也有过类似的经历,20世纪20年代股票价格变动的同步性也较强,以后稳步地下降。

研究者为了验证上述假设,设定了有关的自变量和因变量。人均GDP这个自变量概念明确,统计资料的口径也一致。反映价格变动同步性的变量设定则是一项新的工作,研究者取同步度R2,并赋予可操作的度量算式。然后,根据统计资料计算40个国家的相应指标,得出同步度最低的国家为美国、爱尔兰、加拿大、英国和澳大利亚,同步度最高的国家和地区为波兰、中国、马来西亚、中国台湾地区和土耳其,并经统计分析验证了股票价格变动同步度和人均GDP之间呈负相关的假设。

研究者在统计数据分析基础上进一步寻求理论解释,为何股票价格变动同步度和人均GDP存在显著的负相关关系,人均GDP是反映经济发展的综合指标,是否有某些经济发展因素引起价格同步变动,而人均GDP是这些因素效应的反映。所以,进一步去找其他与价格同步度相关的因素,并分析这些因素与人均GDP这个变量之间的关系。

研究者将这些因素分为两类:一类是结构性变量,包括经济地域规模、宏观经济的稳定性、经济的多样性等;另一类是体制性变量,包含会计标准指数、股东权利维护指数和政府信息透明度。通过实证分析这些因素与同步度之间的关系,发现结构性变量对同步度的效应不显著,而体制性变量则效应显著。

针对上述实证结果,研究者赋予同步现象的机理解释。会计标准指数和股东权利维护指数愈大,意味着股东防止公司经营者营私舞弊的能力愈强,公司股票价格和公司经营信息挂钩愈密切,而和整个市场信息的关联较弱,导致同步度较低。同样,政府信息透明度和清廉程度较高使得市场整体波动较小,而减小同步度。美国20世纪20年代以后股市价格变化受市场整体波动的影响愈来愈小,而上市公司具体信息的影响愈来愈大,说明美国股市当年也经历过现在发展中国家股市类似的状况。

研究者进而对出现同步度和人均GDP负相关的机理作了如下的结论性解释:①发达国家和发展中国家比较起来,公司具体信息较多地与公司股票价格挂钩。由于许多发达国家的有效法律保护,公众股东可以阻止公司经营者的舞弊行为。会计标准指数因素如果不存在可问责性(accountability)的环境,则对股市价格不会有什么影响。②发达国家股市整体波动较发展中国家要小,这反映政府对私人产权保护的程度不同,政府对公司的干预使得股市价格随政府政策波动而并非取决于经济因素。③发展中国家股市作为经济信息处理器的作用不像发达国家那么有效。熊彼特和索罗(Robert M.Solow)等经济学家强调优化资本积累对于经济增长的重要性,有效的股市应起到信息处理器的作用,业绩好的公司会引来更多资金投入,资金不会去投向那些亏损、效益不好的公司。为了提高股市信息处理效率,政府需制订法律保护投资者免受贪婪的公司经营者和腐败官员之害,否则股市中的隐藏之手将误导资金投向并减缓经济增长。

从现存统计数据发现问题,提出假设,进行实证论证然后赋予理论解释,按这种技术路线做的研究工作必然有个性,研究者的贡献和创新容易凸显清楚。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈