首页 理论教育 连续型变量数据缺失很多怎么填补

连续型变量数据缺失很多怎么填补

时间:2022-03-13 理论教育 版权反馈
【摘要】:第一节 变量的定义变量的定义就是把收集到的信息,按照SPSS的规则,转化为SPSS能识别的格式。注意字符型变量的缺失值必须定义,因为此时SPSS把“.”看成一个字符,而不把它看成缺失值。
变量的定义_现代社会调查方法

第一节 变量的定义

变量的定义就是把收集到的信息,按照SPSS的规则,转化为SPSS能识别的格式。是SPSS进行数据录入、数据预处理及统计分析的前提。

打开SPSS21,单击左下方的“变量视图”(Variable View)标签,切换到变量定义的界面,如图11-1所示(以student.sav为例)。变量视图中各个栏目的意义及功能如下:

1.名称(Name)栏:用于设定变量名,SPSS早期版本中变量名长度应在8个英文字母(或四个汉字)以内。从12版本开始,变量名最多可以有64个字符。不过变量名的定义还有一些限制,例如不能以数字开头,中间不能有空格。一个文件中不能有相同的变量名等。

img167

图11-1 student.sav的变量视图

2.类型(Type)栏:选择该框时右侧会出现如…的按钮,单击它会弹出“变量类型”对话框如图11-2所示。它用于设置变量类型,相应的可以在右侧更改变量运算宽度等格式,一般按默认的数值型即可。

img168

图11-2 变量类型对话框

3.宽度(Width)栏:设置变量运算宽度,如数值型默认为8位,根据需要可更改。本例设置为6。

5.标签(Label)栏:用于定义变量名标签,该标签会在结果中输出,它通常是问卷中封闭型问题的题目。对于需要详细了解变量意义的读者,在这里使用中文阅读输出的结果将非常方便。

img173

图11-3 变量值标签对话框

img177

图11-4 缺失值对话框

8.列(Columns)栏:定义显示列宽,实际上它用的非常少,因为改变列宽最简便的方法就是将鼠标放在数据窗口中两个变量名的中间直接拖动。

9.对齐(Align)栏:定义显示对齐方式,有左、中、右三种,数值型变量默认的是右对齐。

10.度量标准(Measure)栏:定义变量的测量尺度,这是很重要的一步,它对变量的测量水平进行准确的定义,在一些分析方法和绘制交互式统计图等方面非常有用。对于数值型的变量,它默认的测量水平是“度量(S)”(Scale),包括定距或定比测量(SPSS在这里并不区分它们,遗憾!)。其他的分别是“序号(O)”(Ordinal)和“名义(N)”(Nominal)。

11.角色(Role)栏:最近几个版本中新增加的属性,主要目的是要与SPSS的数据挖掘软件SPSS Modeler(原SPSS Clementine)进行无缝连接,适应数据挖掘模型中对字段(变量)的要求。其中的“输入”就相当于自变量,“目标”就相当于因变量,“两者”就是指变量既是输入也是输出,“无”指的是变量没有角色分配,不参加分析,“分区”是指变量用于把数据划分为单独的训练、测试与验证样本。在SPSS中默认即可。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈