首页 理论教育 调查问卷的编码方式有哪些

调查问卷的编码方式有哪些

时间:2022-03-11 理论教育 版权反馈
【摘要】:编码的目的是用一组变量来表示各项调查问题,用每一个变量的不同取值表示对这一问题的不同回答。研究者在访问结束后,对问卷进行的编码被称为后编码。因为这些问题往往很难预计,只能在调查问卷回收之后,根据具体的答案设定编码的形式。这种问卷的编码,只要将被调查者在问卷中所选择的项目代号或数字填入相应的编码栏中即可。
调查问卷的编码_社会调查与统计

编码就是给每个问题及答案一个数字作为它的代码,将问卷中的文字转化成数字的过程。定量调查的数据一般要输入计算机,用计算机进行整理和分析,数字代码为计算机的输入和分析提供了方便。编码也是数据整理汇总阶段重要而基本的环节。编码的目的是用一组变量来表示各项调查问题,用每一个变量的不同取值表示对这一问题的不同回答。比如,调查对象是否是党员,可用“1”表示“党员”,用“2”表示“非党员”。需要注意的是,在定类和定序变量的编码中,数字仅起到一种代表的作用,并不说明任何数量上的意义。

一、编码的方式

编码的方式主要有三种:前编码、边缘编码和后编码。

所谓前编码,指的是研究者在问卷设计时事先为每一个题目的答案设置一个代码,编码时只要逐一记录被调查者回答的选项代码即可,这种编码的方式与问卷设计是同步进行的。前编码又称预编码。封闭式问题通常采用就是前编码的形式。

所谓边缘编码是为了提高录入和查错时的工作效率,在问卷上预留编码的位置,这些预留的编码通常在问卷的最右边,并用竖线与问题部分隔开,因此称为边缘编码。边缘编码是编码的一种表示形式,一般在数据录入之前编码的表示形式都是边缘编码,也就是将编码值写在相应调查指标对应的位置,然后根据编码录入数据。

研究者在访问结束后,对问卷进行的编码被称为后编码。开放式问题和封闭式问题中的“其他”选项的编码,通常是采用后编码的形式。因为这些问题往往很难预计,只能在调查问卷回收之后,根据具体的答案设定编码的形式。

这里要说明的是,究竟是采用前编码还是后编码的形式并没有固定的顺序和要求,研究者可根据自己的研究需要与进度而定。

二、答案代码的确定

答案代码的确定是编码的重要内容。编码一般分为两步[3]:第一步是对回答问题进行分类;第二步是建立回答类别与变量数值间的对应关系。

对问题进行分类,指的是在设计问卷时,每一个指标或变量设置几个选项的问题。简单的变量,如“性别”,答案只有“男性”和“女性”,比较好确定类别和答案代码。而对于一些复杂的指标或变量,如“收入”,答案可能是十几种甚至几十种,如1500元,2100元,2500元,3000元,等等,就需要将其编为几十个数字;也可以将其划分1500元以下,1500~3000元,3000~5000元,5000元以上几类,编几个数字;或者只划分为高收入和低收入两类,设置两个数字。到底采用哪一种形式,根据研究的需要而定,因为答案形式的不同,也决定答案代码设置时的差异。问卷中封闭性的问题,一般在问卷设计时已对问题进行分类,并确定了答案代码,见表7-3。这种问卷的编码,只要将被调查者在问卷中所选择的项目代号或数字填入相应的编码栏中即可。


表7-3 调查问卷

img60

表7-3中,问题的代码分别是A1、A2、A3、A4,问题中每个答案的数字就是答案代码,如A1中,“1”表示“男”,“2”表示“女”;A2中“1”表示“未婚”,“2”表示“已婚”,“3”表示“离异”,“4”表示“丧偶”,这样就把原来的文字转换成了数字。编码时直接将被调查者选择答案的代码写在右边的编码栏中即可。而像A3题的答案是具体的数字,可直接在 上填答数字,就直接用被调查者填答的数字作为其回答的代码值。如果被调查者在横线上填答了“2008”,则可以直接将这一数字作为答案的代码。

对于开放性的问题,因事先不能预料答案的情况,不能进行事前编码,这时编码就要从第一步对问题回答的分类开始。具体的做法是,可以先从回收的问卷中随机抽取一些问卷,将这些问卷的答案记录下来,然后根据其不同的特征或内容进行分类,并赋予每一个类型或答案一个数字代码。如表7-3中,A4的答案,经过对多份问卷的整理之后,可以用“1”表示“教师”,用“2”表示工人,等等。那么在对问卷进行编码时,凡是看到“教师”的就用“2”表示。对于分类的数量,如果不加任何限制,不想造成任何误解,类别数目可能会与答案数目一样多,类别过多,就会给分析造成困难;类别过少,则可能会使类别不明确。一般来说,开始分类时可以分细一些,在具体应用过程中,可根据需要进行适当合并。

在编码时,除了对指标或变量的答案进行编码外,问卷编号、访问员编号等信息一般也要进行编码,输入数据库。

三、编码的具体方法

在问卷设计中,我们知道问卷中指标或问题的设置有不同的方式,如单项选择题目、不定项选择题目、多项选择题目等,这就决定了在进行问卷编码时,也要根据具体的题目类型和要求采用不同的编码方法。

1.单项选择题的编码

给出的答案至少有两个,回答者根据自己的情况选择一个答案作为回答的单项选择题目,通常直接使用问卷设计时赋予每一个答案的数值作为其代码值,如表7-3中,A1、A2题每个答案前面的数字就是其代码值,编码时直接将这些数字填写在编码栏即可,如表7-4中题目的编码。通俗地讲,即是“单选题,选什么编什么”。这些代码值都是数字,但只是各种不同答案类别的一个代号或一个记号,不能进行加减乘除运算。


表7-4 单选题的编码

img61

2.多项选择题的编码

多项选择题指的是一个问题可选择的答案不止一个,而是有多个,又包括不定项选择题和多项限选题。

(1)不确定选择个数的多项选择题。不确定选择个数的多选题指的是在调查时不设定回答者对某一问题的选择答案个数的题目。如表7-5中的A5题,被调查者可以选择1个、2个、3个、5个或者10个答案。对于这类问题的编码,因为不确定答案的个数,很难确定预留几个编码为合适,并且考虑到统计时变量的类型特征,结合统计分析中虚拟变量的用法,一般采用“0,1”编码的形式,如果选择了,则标记为“1”,没有选择,则标记为“0”。通俗地讲,即是“任选题,有多少个选项就有多少个变量,每个变量用‘0,1’编码”。如果一个被调查者选择了2、5、6、8、9项,那么,A5题的编码则如表7-5编码栏所示。每一个答案都有一个相应的栏码相对应。


表7-5 不定项选择题的编码形式

img62

(2)确定选择个数的限选题。因为选择的个数太多,有时难以进行统计,因此,多项选择题有时候也会对其限制选择的个数,如表7-5中的A5题,如果选择的要求不是“有几个选几个”,而是设定“请选择最重要的三项”,那么又该如何进行编码呢?

①采用“0,1”编码。即使是设定了选择的个数,也可以“0,1”编码的形式进行编码,这时还是有几个答案就设置几个编码的位置,将其视做任选题,只是选择“1”的答案是确定的,不能超过三个,当然有些人没有那么多的选择,可能只有1~2个答案,也是可以接受的。

②用答案前的数字作为代码。因为答案选择的个数确定,最多选择三项,所以在编码时也可以设定三个编码,以答案前的数字作为代码。通俗地讲,即是“限选题,限选几项就有几个变量,每个变量选什么编什么”。上面A5的编码就变成了下面的形式(见表7-6):


表7-6 不定项选择题的编码形式

img63


对于问卷中的那些跳答/不适用的题目一般用9,99,999等固定的代码。应该填答而没有填答的题目用0或空格来表示,在录入的过程中,可直接空过去,以免与其他有意义的数字代码相混淆。

3.开放性问题的编码

对于开放型题目,如果针对的是定距或定比变量,可以直接用填答的数字进行编码,如“您每月的收入是 元?”,编码时直接采用填写的数字。

而对于非数值型的题目,则先制作编码本,为其中的每一个选项设计一个代码,再进行编码,如“您的专业是 ?”调查完成之后,可以根据随机抽取的一些样本的情况设定代码,如“1=社会学,2=经济学,3=教育学……”进行编码,并录入。

4.编码常用的一些规则

编码涉及的情况很多,需要具体问题具体处理,但在长期的编码过程中,人们也总结出了一些常用的规则。

(1)使用统一的编码表和编码手册。

(2)对答案完整的有问题的编码,可以根据编码表直接进行编码。

(3)对选择答案,有笔误和错别字,但不影响内容的判别时,也根据编码表直接编码。

(4)对答案不明确,或者回答者答非所问,不合逻辑的答案,一般不要进行编码,而是记录下问卷编号、题号等,告知负责人统一处理。不确定的信息需进行查证;在确认的情况下需进行修正;对于一些关键性问题无法查证到时需要作废。

(5)当一个意见在编码表上找不到合适的编码时,编码员不得私自加新码,应向编码督导询问处理办法。编码负责人根据实际情况统一进行处理。

(6)在编码时还经常会遇到半开放型题目“其他”选项中的答案的处理,这是需要确认写在“其他”位置的内容是否已出现在问卷所列出的选项中,若已有,则用答案中已有的代码进行编码,若没有,才按其他选项另作处理。

5.答案栏编码的确定

编码的目的是为了将文字的资料通过设定一定的代码,使其转化到计算机可以识别的数据时更为简便、快捷,在计算机录入数据的过程中,特别是一些专门的数据处理软件,如Foxpro软件,除了考虑答案的数字代码外,还要考虑每一个题目答案的宽度和栏码数,在数据库编写时进行相应的设置,为数据的录入提供方便。每个问题答案代码的位数通常称为编码的宽度。栏码则是在数据转录到登记表上或者录入数据库时每个变量所处的位置,它是根据每个指标或问题答案代码的位数,确定该项目或问题所占的宽度,再根据前后顺序来确定其在整个数据排列中所处的位置,从前依次往后排列。

答案的栏码数一般在设计问卷时就直接印在问卷中,如表7-3中右侧的编码栏,每一个问题对应编码的横线个数表示这一问题编码的宽度,如性别的两个取值“1=男;2=女”,那么,这一题目对应的栏码数是1;到城市工作的时间是哪一年,如2005,那么它对应的位数应该是4位,所以在设定编码栏时设定4位栏码。如表7-3中各问题的栏码分配表则如表7-7所示:


表7-7 栏码分配表

img64

四、编制编码手册

因为社会调查中涉及的调查问卷和问卷中调查的问题往往较多,问卷的编码大多数情况下一个人很难完成,需要较多的人一起进行编码和数据录入,因此,制定统一的编码表或编码手册,就可以要求编码者按照统一的编码要求完成问卷资料的转换。

在编码手册中,研究者要将需要编码的项目和问题一一列出,逐一规定它们的代码、宽度、栏码、简要名称、答案赋值方式及其他特殊情况的说明等。整个编码手册要规范统一,指示要明确,并且容易理解,便于操作。

表7-8就是一份调查问卷的编码手册的节选。“指标或变量”是问卷中进行调查的各指标或变量。“变量名”是调查问卷中实际测量的每一个变量在录入计算机时对应的名字,通常用与问卷中题目相对应的字母和数字表示,这样可以较为方便地根据问卷查找相关的数据。“变量含义”则简要地说明该变量所反映的主要内容。“答案赋值”即各问题答案所对应代码的说明,非常重要,需要详细地标明每一种答案的赋值结果和赋值方法。“宽度”和“栏码”是数据库建立和数据录入的时候需要用到的重要内容。“备注”一般是对其他需要说明的内容进行说明,特别是对缺省值、跳答等内容的说明。


表7-8 编码手册(节选)

img65

有了编码手册,不同的调查员(或专门的编码、输入人员)就可以按照同样的标准和方法对收回的问卷进行编码。同样,资料分析员也可以方便地认识、理解数据资料中所包含的各个变量的信息。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈