首页 百科知识 数据的录入

数据的录入

时间:2022-04-29 百科知识 版权反馈
【摘要】:二、数据的录入问卷回收后经过确认和编辑之后,我们还不能直接对问卷进行分析,因为如果直接对问卷进行分析,工作量过于庞大,而且出现误差或偏差的几率也较高。图3.6 利用SPSS统计软件进行问卷的编码编码过程中,对于问卷中的开放式问题,往往还需要先做更多的工作。机器录入是目前数据录入工作最常选用的录入方法。图3.7 在SPSS统计软件中的录入完数据的数据库其次,还要检

二、数据的录入

问卷回收后经过确认和编辑之后,我们还不能直接对问卷进行分析,因为如果直接对问卷进行分析,工作量过于庞大,而且出现误差或偏差的几率也较高。在分析之前,调查者需要把受访者所回答的信息进行量化,这样就可以通过运用电脑来进行统计与分析,而且目前已经有相对成熟的统计分析软件,这也可以相对减少调查者的工作量。

如果要对问卷进行量化的分析,就需要把受访者对问卷中每一个问题的答案先进行量化。这就需要先把问卷中的信息进行编码,并把编码的数据信息录入电脑。

1.问卷的编码

在将回收好的问卷进行确认和编辑之后,调查者就需要对通过调查所获得的信息进行量化,以便应用统计学的原理和方法来对这些信息进行分析。这个量化的过程就是对问卷进行编码,也就是对问卷中同一个问题,受访者给出的不同回答进行分组和确定数字代码的过程。由于目前电脑的广泛应用,同样也为问卷的统计提供了更加便捷的方法。我们也主要介绍一下如何将调研获得的信息转换成电脑能够判断、阅读并进行分析处理的信息——机读格式,以便于对这些信息进一步进行量化的分析。

一般来说,问卷调研中的问题多数都是封闭式的,这些问题就相对容易编码,只要按照不同答案对应不同的数字来进行编码即可。例如:

您一般从哪里获取商品信息?(可多选)

A.父母亲人  B.朋友  C.店堂销售人员  D.报纸杂志

E.电视等电波媒体  F.互联网  G.直邮

这个问题就属于完全封闭式问题,我们可以给每一个答案进行编码,回答“A”的编码为“1”,回答“B”的编码为“2”,依次类推。调查者就可以根据这样的方法对封闭式问卷进行编码。如果采用一些统计分析软件,就可以直接在电脑里为问卷中的各个变量进行编码,图3.6就是在SPSS(社会科学统计分析软件包)中,为上面的这个题目的选项进行编码。

在问卷当中,有些问题需要对于问卷中的信息要按照不同的特征,把某些答案归类为一些变量,而每个变量都可能包括了多个答案。比如说,对于受访者的职业的调查问题,得到的答案可能是有很多种的,遇到这种情况时,一种做法是将受访者所回答的每种职业分别都给出一个数字代码,但是由于职业的种类太多,很多时候这种做法对于调查者的分析工作没有太多的帮助;另外一种做法是,将社会中现有的职业进行分类编码,一般有两种方法:一是将职业区分为专业技术类、管理类、职员类、技术工人类等等,二是将职业依照不同的经济部门来区分,如制造业、商业类、科研教育类、农业类等等,这两种职业区分方法也并不是能够完全满足调查者的研究需要,所以常常是两种方法结合使用。

img38

图3.6 利用SPSS统计软件进行问卷的编码

编码过程中,对于问卷中的开放式问题,往往还需要先做更多的工作。因为开放式问题所得到的信息不像封闭式问题那样可以简单的数字化,而是需要调查者查阅每份问卷中的同一道开放式问题的答案,然后对这些答案根据某些特征先进行简单的分类,然后再对这些类别进行编码。为了避免由于分类过粗,而使一些受访者的信息被忽略,就需要在分类的时候尽量将类别分得细一些。开放式问题的编码,会由于调查者的判断而存在一定的主观性,所以问卷调查中不宜过多地设计开放式问题。

问卷的编码方案必须要结合实际研究的特别需要来进行,但是其中也有一个基本的原则:即编码时尽量把信息的分类做得很细,因为一旦在研究中不需要这么细的分类的时候,可以把这些信息进行重新的归类合并。但是如果一开始进行编码的时候就把分类做得比较粗略,那么分析的时候就有很多细节性的信息会因为这种分类方法而被忽略掉。

2.问卷的数据录入

编码工作结束后,就可以开始数据的录入了。如果研究者是选择通过计算机来进行数据分析,就需要把问卷的数据输入到电脑中,把问卷中的受访者对于每个问题的答案信息转化成电脑能够识别的数字信息。基本的数据录入有两种方法:人工录入和机器录入。

人工录入是指将编好代码的问卷交给数据录入人员,由他们按照问卷中的每个信息的代码依次进行录入。这种数据录入的方法,需要录入人员在录入数据时仔细核对,因为这种数据录入方法在录入过程中很容易产生错误。

机器录入是目前数据录入工作最常选用的录入方法。智能录入是指录入人员先将问卷中的编好代码的信息记录在光学扫描纸上,然后通过电脑或其他电子识别装置自动把这些数据录入。这种自动化的数据录入方法,相比人工录入要更准确更快,但是这种方法也有自身的缺点,就是将问卷中的信息转化到光学扫描纸上也并不是一件容易的事情,这种录入方法所依赖的一些扫描装置也会增加调查的费用。

有些调查活动为了节省从问卷到光学扫描纸的信息转化的过程,而选择直接让受访者或访员在专用的答案纸上做记录。只要将这些答案纸妥善保存,没有什么折损的话,光学扫描仪就可以直接从这些答案纸上扫描录入数据。但是这种方法却为受访者在接受调查时增加了难度,因为有时候受访者会搞不清楚到底是要在哪一行的哪一个位置做记号,这就增加了受访者接受调查的时间。

不论采用人工的录入方法还是机器的录入方法,都要求调研者将问卷进行编号,以便不会将同一份问卷的数据录入两次。

3.数据的整理

不论调查者使用的是什么样的数据录入方法,如果顺利的话,数据全部录入完成后,就可以有了一个供机器来进行分析的数据库(图3.7)。而在分析开始之前,还需要清除数据库中的错误数据,也就是对录入好的数据进行整理。因为不管在录入数据的时候工作人员的工作是如何的仔细、小心,还是难以避免错误数据的产生,可能发生编码的错误、录入数据时位置错误等等,这些错误的出现会对整个数据库的准确性带来影响,严重的会出现统计错误的情况。

数据的整理是在把数据进行图表化和分析之前的必需的检验工作。在这个工作中首先要进行错误检查。例如:在对问卷进行编码时,关于受访者的性别,只有3个可能的编码:1.男性,2.女性,0.没有回答。如果在某个问卷中,在性别这个变量上出现编码为5的话,那这就是一个很明显的错误。这种错误的检查可以通过调查者翻阅问卷或利用统计软件中的相关程序来完成,一旦发现错误就需要及时的纠正。

img39

图3.7 在SPSS统计软件中的录入完数据的数据库

其次,还要检查一些逻辑上的错误。例如,问卷中某道题目是专门设计来问女性受访者的,而所有的男性受访者应该跳过这个问题不作回答。但是如果发现在性别选项上填的是男性的人,也对这个问题给出了答案,这就是逻辑上的错误,对于这样的错误需要及时纠正。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈