首页 理论教育 研究资料的管理

研究资料的管理

时间:2022-03-03 理论教育 版权反馈
【摘要】:表面看来,对研究数据与资料的管理并不产生新的成果,既不是对数据的统计分析,也不是对研究材料的审查。但是这项工作对整个研究工作的作用却是不可低估的。对文字资料的管理主要包括分类与汇总、编目录及保存三项工作。一般说来,不同的研究资料其分类方法也是不同的。在这里我们主要谈当研究设计思路初步确定之后,文献资料的收集与分类。当研究对象涉及的因素较广泛且复杂时,尤以这种方法为佳。

表面看来,对研究数据与资料的管理并不产生新的成果,既不是对数据的统计分析,也不是对研究材料的审查。但是这项工作对整个研究工作的作用却是不可低估的。对文字资料的良好管理带给研究者的是清晰的思路、快捷的文献查寻与利用;对数据资料的良好管理带给研究者的是更多的利益,高效的检索方式节省了时间,相对于统计分析的独立性使数据免受污染,即使多次重复使用数据,研究者也尽可放心,因为这些数据总是安全可靠的。

下面,我们就文字资料与数据资料两方面来谈谈研究资料的管理。

一、文字资料的管理

一般说来,文字资料包括文献资料、研究工具以及研究成果。对文字资料的管理主要包括分类与汇总、编目录及保存三项工作。

(一)文字资料的分类与汇总

1.分类 对研究资料进行分组归类是资料整理工作中的环节之一,也是汇总资料的前提。所谓资料的分组、分类,就是根据资料的性质、内容或特征,将相异的资料区别开来,将相同或相近的资料合为一类。分组、分类是否适宜、正确,关键取决于分组、分类的标准。

文字资料的分类有两种,即前分类与后分类。前分类(pre-sorting)指在研究设计时就按一定的分类指标去收集资料;后分类(post-sorting)是指在所有研究资料都收集以后,根据资料的性质、内容或特征将它们分别集合成类。一般说来,不同的研究资料其分类方法也是不同的。

(1)文献资料的分类:前面曾谈到过,文献资料首先对于课题选择是十分重要的,也就是说,在课题未确定之前,文献的查阅已展开了。在这里我们主要谈当研究设计思路初步确定之后,文献资料的收集与分类。可采用的标准一般有以下几种:

A.按作者分类:使用这种分类指标适用于文献资料较集中的情况,如某一领域的研究成果仅局限于几个人,并且文献不是很多的时候,使用这种方法可以迅速地收集到较齐全的文献资料。

B.按研究内容分类:这是较为普遍采用的方法。当研究对象涉及的因素较广泛且复杂时,尤以这种方法为佳。例如我们研究有关“青少年违法和犯罪行为”的心理学问题,这无疑是一个很大的课题,研究对象是青少年违法、犯罪行为,其涉及的因素是多方面的,如家庭生活环境、家庭结构、父母教养方式、学校行为、同伴关系、亲子关系等等,甚至这些因素还可以再细分出子因素,如亲子关系可分成父子(女)关系和母子(女)关系等。对这样庞大的变量群,便可以分而视之。首先,确定与“青少年违法和犯罪行为”有关的主要因素(如上所述),再依次查寻。这种先分类再查寻的方法可以较集中且快速地查到文献,但是由于事先确定了分类指标,所以就容易丢失那些所谓“不是主要因素”的相关文献资料。反过来,如果先泛泛地查然后再分类,虽可以弥补这一缺陷,但是查起来甚是费力费时,且等到分类之时,面对大量的文献,分类的工作量也是很大的。所以,对于文献资料来讲,前分类与后分类各有利弊,研究者可根据自己的需要进行选择,也可以两者结合使用。

C.按时间分类:这种方法适用于研究有较长历史,且随着研究的深入其主要理论不断发生演变的那些问题。这种情况采用后分类为宜。当文献资料收集上来之后,按理论的进展分成不同时期阶段,每一阶段为一类。

D.按理论背景分类:前一标准只涉及一个理论流派的连续研究,而这一标准涉及的研究是那些各理论派别各持己见、纷争不已的问题。这样就可以按理论派别将文献划归入类。

综上所述,文献资料的分类标准是很多的,研究者要本着高效、齐备的原则选取适当的指标,可能是单一的指标好,也可能是多种方法共同作用较为理想。此外,在这里,我们虽然是谈文献资料的分类,但实际仍然离不开文献的查寻(见第四章),这再一次证明了文献查寻的重要性。

(2)研究工具的分类:文字的研究工具不外乎各种测验、量表、问卷与行为核查表等。一般说来,对这些研究工具的分类以内容为标准即可。但也有根据其他指标分类的情况,如对不同年龄的个体,使用的智力测验是不尽相同的,这时可以以年龄为指标分类。

总的说来,只有当研究课题是一个庞大体系时,才会涉及对研究工具的分类,一般小型的课题,其研究工具也较少,不涉及对研究工具进行分类的问题。

(3)研究成果的分类:这里的研究成果包括两方面的内容:一是使用各种研究工具收集到的资料,这是尚未深加工的成果,好比林业工人采伐劳动的成果;二是研究报告,是前一种成果深加工的结果。在此我们着重说明前一种成果的分类问题。

一般情况下,对这部分资料进行分类的标准有以下几种:

A.以年龄为标准:多数情况下,年龄是分类的指标。但是研究者要根据自己研究课题的内容、特征来确定具体的划分阶段。一般说来,年龄划分是有规律可循的,即年龄愈小,其年龄段跨度愈小。比如,婴幼儿的年龄段划分多以月为单位计算,而成人的年龄段跨度有时高达10~20岁。

B.以年级为标准:这种标准适用于以学校学生为对象的研究课题。其实这也是一种年龄指标——学校年龄。在学校这种特殊背景下,年级分类要优于自然年龄的分类,因为很多研究变量是与年级有关而与年龄的关系不大。

C.以被试某一特征分类:当所研究的群体年龄段较集中,或者年龄不是所研究的变量时,我们可以被试的某种固有特征为标准来划分。比如,对大学生心理健康的调查,我们可以按学科专业分类:理、工、医、文等,也可以按学校的优劣等级分类,还可以按学校的地理位置分类等等。这些标准的选择不是固定的,研究者要根据自己的研究内容来灵活选取。

在谈到研究数据的分类时,不可避免地要提到排序的问题,这主要是由于使用计算机进行统计分析而产生的要求。一般情况下,排序的工作是在分类基础上进行的,我们给每一位被试的资料一个序号,这个序号本身不参与统计分析,但是它要尽量反映出分类的特点。如果我们按年龄分类,可在序号上反映出年龄的特征,如1001(10 岁组),2001(20 岁组),3001(30岁组)……表面看来人为地增加了工作量,但实际上按分类严格排序的资料使用起来十分方便,无论是核查还是检索均可迅速完成。但如果不按一定分类排序或是排序不严格的话,不仅不能提高工作效率反而会影响工作进展。

2.汇总 对文字资料进行分组、分类,可以使大量繁杂的资料条理化。而对文字资料的汇总则可以使之系统化。资料汇总就是在资料分组的基础上,根据分组的标志和数目,把收集到的资料分别归入各组各类之中,从而集中、简明地反映文字资料的概况。文字资料的汇总可以参阅有关心理与教育科学研究方法书籍,在此不作介绍。

(二)文字资料的编目录

所谓编目录就是对已分类的文字资料按其分类指标编写出目录。其目的是便于查寻、检索与补充。

分类工作的好坏会影响到目录的编写工作。此外,在编写目录时一定要注意把每一份资料都编写进去,不能有遗漏。并且编写目录要本着简洁、清晰的原则。当我们去索引文字资料时,首先接触的不是原始的资料而是目录,通过简洁明了的目录来查寻所需要的资料。所以目录的编写不是多余的而是很有必要的,它避免了研究者从大量的资料中一份一份查寻之苦,可以节省许多时间,提高工作效率。

(三)文字资料的保存

对文字资料的保存一般有两种方法:一是档案法;二是磁盘法。

1.档案法 档案法(file method)是将整理好的资料按其分类特点分类保存,可利用文件柜、文件架、文件夹等工具。对文字资料的保存应有专人负责,无论是检索、查阅,还是使用都要有一定的规则制度,保证资料的完整,即不因为研究者的使用而丢失或改变。另外,目录与原始资料应分开保存,这可以使原始资料免受不必要的翻阅。使用者应首先查目录,查到所需的资料时再翻阅原始资料。

2.磁盘法 磁盘法(disk method)是由于计算机的利用日益普及,研究者常把一些常用的资料录入电脑,用磁盘制作备份文件保存起来。与档案法比起来,这种方式有以下的优点:

(1)可节约存放空间,一张薄薄的软盘可存放很多篇文献资料或一项研究的所有数据;

(2)在撰写研究报告时可以利用电脑对多个文件进行剪贴,这样,修改与编辑起来十分迅速方便;

(3)查阅方便,比手工翻阅要快捷得多。

但是用磁盘法保存文字资料也有其不足之处:

(1)需要花费很多的时间与人力去录入文字资料。如果把每一篇文字资料都录入电脑是不太现实的,所以在用磁盘保存文字资料时,研究者要有选择地录入。根据我们的研究经验,研究执行部分是主要的录入对象,文献资料一般很少用磁盘法保存。

(2)由于磁盘常有受病毒浸染的危险,录入的文字资料会丢失或缺损。尽管多作备份,依然不如原始资料安全。因此,对文字资料的保存应以两者结合为佳,用磁盘保存的资料也要打印一份文字出来,以防遇到磁盘信息丢失的情况。

二、计算机在数据资料管理中的应用

上面我们谈到了关于文字资料的管理工作。在这里要谈的数据管理是特指已编码的数据在计算机上的管理工作。由于计算机科学的飞速发展,它对人类生活的各个方面都产生了巨大影响,心理与教育科学的研究也不例外。所以,我们专门谈谈怎样应用计算机管理研究数据和怎样应用计算机来进行研究数据的统计分析。

(一)数据管理

1.数据 数据(data)是一种物理符号序列,它用来记录事物的属性。广义的数据可以分为两类:一是数值型数据,如学生的成绩、反应时等可以进行计算的数据;二是字符型数据,如人名、科目名称等不能进行计算的数据。在心理与教育科学研究中,观测数据或数量事实(即数值型数据)在统计学上就叫数据。

在心理与教育统计学中,依据获取观测数据的方法,可以把数据分为计数数据和测量数据。计数数据是指计算个数的数据,而测量数据是指借助于一定的测量工具或一定的测量标准而获得的数据。测量数据依其是否有绝对零点和相等单位,又可细分为三种水平:其一,既无绝对零点,又无相等单位的顺序变量(或序级变项)(ordinal variable);其二,有相等单位,但无绝对零点的等距变量(interval variable);其三,既有相等单位,又有绝对零点的等比变量(或比率变项)(ratio variable)。观测数据按其是否具有连续性可划分为连续变量和离散变量。连续变量(continuous variable)是指在量尺上任何两点之间都可加以细分,可能取得无限多大小不同的数值。离散变量(或间断变项)(discrete variable)是指在量尺上任何两点之间,这个变量取的可能数值的个数是有限的。不同性质的数据,必须用不同的统计方法来处理。

概括来讲,观测数据有三个特点,即离散性、变异性和规律性。(1)研究中收集到的数据都是以一个个分散的数字形式出现的,这是数据离散性的表现;(2)若对同一研究对象进行多次观测,即便使用同一种测量工具,那么所获得的数据也不会完全相同,数据的这种性质称为变异性;(3)尽管心理与教育科学的研究数据具有变异性或多种可能性,但是随着实验观测次数的增加,这些变异性很大的数据总会呈现出一定的规律性,即它总是围绕着一定的值上下波动,这是数据规律性的表现。因此,在心理与教育科学实验或调查中所获得的数据,具有变异性和规律性两重特性。

2.数据管理 数据管理(data arrangement)是指对数据的组织、编目录、存储、检索、维护等。从心理与教育研究中获得的数据往往数量巨大而且涉及的变量复杂多样。如果仅凭人工管理这样庞大的数据需要耗费的时间、人力是不可想像的。随着现代化科技的发展,研究者们找到了一个得力的助手——计算机来帮助管理研究数据,也正是因为有了这个工具,心理与教育各领域的研究才得以进一步复杂化、深入化。

(二)数据管理的基本步骤

以计算机来处理数据管理,其过程中包括了许多关系密切的运作步骤,其基本步骤如下:

1.数据编码 这一项工作在第一节已详细介绍了,在此不赘述。

2.建立数据库 数据库(database)是以一定方式存储在计算机存储设备上的、相互有关的数据集合,供数据处理时使用。一般根据变量情况决定数据库的结构,有时,当数据变量过多或被试量过大时,可把它分成几个子数据库,但不要忘记保持所有子库之间至少有一个相同的变量,否则,无法将几个库联结起来使用。

3.数据输入 数据的输入是一项细致的工作,需要选择责任心强、一丝不苟的工作人员,以避免太多的由输入操作引起的误差。

4.审核数据 尽管我们选择了优秀的数据输入人员,但数据的可靠与准确性仍不能得到最大保证,这就需要对已输入的数据进行必要的审核。核查的工作可以在输入时进行,这时的审核方法主要是逻辑审核。更主要的审核方法是重新对所有数据的准确性进行检查,一般是再请另一位输入人员把全部数据输入进去,把先后两个数据文件进行比较。一般说来,经过这样的全面审核后的数据其误差已很小了,不会对数据处理结果产生大的影响。

5.建立备份文件 正如在前面文字管理中所讲的,使用计算机管理资料一定要对文件建立备份,以免丢失或损坏。数据资料更是要小心,因为数据量大,其输入与核查已费了很大人力与时间,万一发生不幸,损失会很大;如果有备份文件,就不怕意外的数据损伤了。

除了上述基本管理步骤以外,我们还可能遇到修改数据库、添加数据、删除数据等工作。总的说来,正是由于计算机数据库系统的使用,使得这些工作变得十分便利。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈