社会指标和测量量表

时间：2022-06-29 百科知识版权反馈

【摘要】：4.2　社会指标和测量量表4.2.1　社会指标社会指标是社会调查不可缺少的工具与手段，要正确使用指标，就必须对指标的概念、类型及作用有初步的了解。社会指标必须是对反映社会现象具有关键意义的或具有代表性的项目。社会指标是有明确的时间规定的项目。

4.2　社会指标和测量量表

4.2.1　社会指标

社会指标是社会调查不可缺少的工具与手段，要正确使用指标，就必须对指标的概念、类型及作用有初步的了解。

1.社会指标的特点与类型

社会指标是反映社会现象的数量、质量、类别、状态、等级、程度等特性的项目。如国民生产总值、人口自然增长率、职业满意度、社会安全感等。

(1)社会指标的特点⁽⁸⁾

①具体性。也就是说，社会指标不是抽象的、一般的概念，而必须是具体的或可以直接被感知的项目。例如，“人口”、“人均收入”、“每万人口犯罪人数”是非常具体的项目，而“职业满意度”、“社会安全感”等反映的是主观的社会现象的指标，虽然不十分具体，但却是可直接感知的，而像“社会经济发展状况”、“现代化”等既不具体，又无法被直接感知，因而它们不是社会指标，只能用一组指标来说明。

②可量度性。社会指标必须是可以用数字、符号进行量度的项目。例如，“人口”、“人均收入”、“产值”等指标就是可以直接计量的项目，而“职业满意度”可以用“很满意”(赋值为2)、“基本满意”(赋值为1)、“无所谓”(赋值为0)、“不满意”(赋值为－1)、“很不满意”(赋值为－2)等符号或数字来量度。

③代表性。社会指标必须是对反映社会现象具有关键意义的或具有代表性的项目。如对于反映人口素质状况来说，平均寿命、人均教育经费、每万人口中大学生文化程度的比重、每万人口中科技人员比重、每万人口中医生比重等项目，就具有关键意义或代表性，而像人口数量、人口密度、身高、体重等则是次要的项目。

④时间性。社会指标是有明确的时间规定的项目。没有明确的时间规定，调查就会失真甚至无法进行。如“人口总数”这一指标，就必须明确是年初数、年中数还是年末数，因为这三个时间点的人数是不一样的，“社会安全感”等反映主观现象的指标，一般都应明确规定是调查时的情况，因为这些主观现象也会随着时间的推移而不断变化发展。

在公共管理研究中，我们是把社会现象涉及的概念当成一个变量，然后根据操作定义进行测量。测量时首先要说明指标，任何一个变量都有许多不同的指标，这是因为测量所依据的事实可以不一样。例如“年龄”变量可以用岁数来测量，也可以用年龄组来测量，如每五岁为一个年龄组，还可以用年龄段来测量，如少年、青年、老年。每一项指标反映着某一个特定的社会现象，对不同的社会现象应以不同的指标来反映。指标是与现象的质的方面紧密联系着的，但它的建立又是为了考查现象的差异或变异。因此，指标是把现象的质的方面与量的方面密切地结合起来，以便精细地描述社会现象的某一特征。

(2)社会指标的类型

依据不同标准社会指标可以分为不同类型，这里简单介绍两个常用的分类。

①客观指标和主观指标。客观指标是指反映客观社会现象的指标，如人口总数、人均居住面积等，主观指标是指反映人们对客观社会现象的主观感受、愿望、态度、评价等心理状态的指标。如对职业的满意度、对经济体制改革的评价等。在一般社会调查中，一般要将客观指标和主观指标结合起来进行调查，才能更全面、更真实地了解社会情况，但客观指标往往多于主观指标。

②描述性指标和评价性指标。描述性指标是指反映社会现象实际情况的指标，如城镇人口数、生活消费品支出等。评价性指标也称为分析性或诊断性指标，它是反映社会发展、社会效果在某些方面利弊得失的指标，如城镇人口占总人口的比重，每百户居民拥有电视机数、食品支出占生活消费品支出的比重等。描述性指标一般是独立存在的，一个指标反映一种情况，它们是对社会现象的客观描述，单凭一个描述性指标很难做出好坏得失的评价。而评价性指标则不同，它通常是以某种理论为指导，为说明某种社会问题而将两种或两种以上社会现象做比较或进行计算而得出的结果。如城镇人口占总人口的比重，是根据人口城镇化理论，为说明人口城镇化程度而将城镇人口和总人口这两种人数进行计算而求得的。

(3)指标测量的作用

指标测量在社会现象数量化中起着重要的作用。首先，人们通过建立理论即提出概念和确定概念之间的联系达到对现象本质和整体的认识，而指标测量则是把事物或事物的概念性的认识转化成人们可以感知和认识的具体的量的形式，达到新的意义的感性直观。其次，指标测量是对社会科学理论进行实证性检验的必要步骤，指标测量值为社会理论的实证性检验提供了实际的观测数据。

2.指标群

(1)指标群的含义

指标群作为一种度量手段主要用于变量拥有多个指标时的情况，指标群实际上是多个指标相加之和。从严格意义上讲，指标群属于定序测量等级。但在实践中，指标群却常常作为区间或比例测量的变量来使用。⁽⁹⁾指标群在现实生活中使用相当广泛，像我们熟悉的代表美国股票市场走向的“道琼斯指数”与代表香港股票市场走向的“恒生指数”，实质上就是指标群。又如日常生活中人们常使用的“气质”这个较抽象的概念也是指标群。人们用“气质”一词来赞美某个人的气质好，但如果没有亲眼所见，我们很难具体想象这个人的气质好到什么程度，在这种情况下，我们就可以通过使用指标群，得出比较准确的印象，如可以从谈吐、仪表、待人接物、修养造诣等四个方面分别打分，然后再将这些分加起来得到一个综合分数，这个分数能在很大程度上反映出这个人的气质状况。又如，要了解农民对公共品供给绩效的评价状况，可根据我国农村实际情况，从生活类公共品、生产类公共品、服务类公共品三个层面来研究，从农户对距家最近的诊所距离的满意度、对有效灌溉面积率的满意度、对人均小额贷款额的满意度、对农户家庭距城镇距离的满意度等多个项目进行具体测量，然后将对每个项目的评分加起来就可以得出农民对公共品供给绩效评价的满意度。

简单的变量用一个指标就够了，例如“性别”可以用看的方法，工厂规模可以用工人数目这个指标，而不少变量很复杂，范围很广，如研究“工厂科层化程度”变量就拥有多个指标，这就需要我们从中挑选若干个来测量。挑选指标的原则是方便与适当，可采用管理层次、部门数目、消息传递方式、决策形式、管理方式和行政人员所占比例等。各项指标可以分别研究，但有时需要将各项指标综合起来，以提高变量的抽象程度。

指标群具有一个综合结构，指标群需要利用每个指标来度量抽象的概念，概念的每一个层面必须至少有一个以上的指标或问题来度量。一般说来，建立指标群需要首先经过可靠性的测试。由于指标群由多个指标组成，因此，我们后面介绍的“对拆法”与“内在一致测试法”都可以使用，但是，“内在一致测试法”较“对拆法”更为常用，一个指标群的可靠性一般需达到0.70以上才可能获得认可。

(2)指标的加权

在建立指标群时，必须特别注意指标的加权(Wighting)。加权是指对指标群中的某些重要指标赋以特殊的分量。在一个不加权的指标群中，每项指标代表相同的分量，而在一个加权的指标群中，一个加权数为2的指标的分量就相当于两个加权数为1的指标，当然，哪些指标需要加权，加权的分量是多少，则需要我们根据相关的理论与具体情况加以确定。美国伊利诺伊大学社会学系的唐盛明教授曾举了“测量大学综合质量”的例子说明比较加权与不加权的指标群的不同效果及对结果的影响。这里我们做一简单介绍。⁽¹⁰⁾

要测量大学的综合质量，可采用以下六个指标来代表“综合质量”这个概念。教师与学生之比(R)、具有博士或硕士学位教师在教员中的百分比(F)、每个学生可拥有的图书馆藏书(B)、未能获得学位学生的百分比(D)、毕业后念更高学位学生的百分比(A)、教师的平均学术成果发表数量(P)、根据这六个指标，我们得到公式：(－2)R+(2)F+(1)B+(－3)D+(1)A+(3)P=综合质量。

但考虑到这六个指标中，某些指标较其他一些指标更为重要，需要对其中某几个指标进行加权。按重要性排列，我们把这六个指标分为三组，其中最重要的是教师的发表数量和未能获得学位学生的百分比，其次是教师与学生之比和具有博士、硕士学位教师的百分比，最不重要的是图书馆的藏书和毕业后念更高学位学生的百分比，按此重要性顺序加权，我们就得到了加权公式：(－2)R+(2)F+(1)B+(－3)D+(1)A+(3)P=综合质量。运用不加权和加权这两个公式对一所重点大学、地方性大学与专科学校的综合质量进行测量，就会得出完全不同的结果。

在不加权的情况下，重点大学、地方性大学和专科学校的质量完全相等，但是加权后，部属重点大学的质量就高居第一，而专科学校则名列榜尾了，比较加权与不加权这两种情况就会对学校综合质量有不同的评价，也显示出加权的重要性，加权能够直接影响调查研究的结果。

3.对指标测量值的检验

在对统计指标进行测量以后，还要对统计指标测量值进行检验。这是因为在指标的实际测量阶段，把指标概念转化成指标数值需要经过大量而复杂的工作，由于主观和客观、随机和系统原因，都必然会产生或大或小的误差，因此，必须对统计指标的测量值进行检验。

对统计指标测量值有两种最基本的检验：一是可靠性，二是有效性。“可靠性”指的是指标测量结果的可重复性和一致性。可靠指标重复测量后的结果应当是一致的。导致测量指标值不可靠的主要原因是随机性误差。为了减少随机性误差，增加指标可靠性，在指标提出时要仔细研究论证；另外，需要时可建立多个指标，因为多个指标同时受干扰的可能性相对一个指标来说会大大缩小。“有效性”指的是该指标是否真实地反映数量化的现象和概念。影响指标值有效性的是测量过程的一些非随机干扰因素，又称为系统误差。由于系统误差无数量性规律可循，因此系统误差的发现和消除，必须通过定性分析，仔细研究和检查每个影响因素，剔除系统因素的影响。

4.2.2　量表

量表是公共管理研究中被广泛应用的一种测量工具。其主要作用是测量复杂的概念。由于社会研究者所希望研究的许多概念不可能只用一个单独的指标来测量，因而人们创造出各种量表来达到测量的目的。

1.量表(Scale)的概念

Scale又译为尺度，是专门化的测量工具。从广义上讲，在量化研究中所有用来收集资料的工具都是量表。问卷实际上就是一种量表，它是通过问卷的方法去测量研究对象的特征或社会现象之间的关系。从严格意义上来说，量表通常是指一种主观量表，社会调查中所说的量表，主要是用来测量人们的主观状态，其中包括态度、意见、价值观念等，因此，量表也被称为态度量表。

差不多每个社会现象都可以测量，一些现象如“家庭收入”等可以直接测量并得到准确的数值，而其他现象或概念倾向如“犯罪”就需要使用替代物才能间接地对它进行测量，而且可能不会非常准确。创造量表“是种特别困难与精细的事业，需要极为细心的思考”，⁽¹¹⁾一个成熟的量表是经过不断测试修改后才能完成的，由于科学研究具有积累性质，我们可以借鉴前人或其他研究者所使用的测量工具，实际上，研究者已经建立了很多不同的量表来测量社会变量。例如，已经发展出一些量表来测量职业声望、人们对婚姻的调适、团体互动的强度及国家社会经济发展的程度等，可以根据自己的研究目的加以改良。

总之，量表相当于一把尺子，它的作用在于精确测量一个较抽象的或综合性较强的概念，特别是度量态度和观念。量表能比单一指标或单项问题的测量获得更多、更真实、更准确的信息，能通过间接的、定量的方式衡量那些难以直接观测的、难以客观测量的社会现象。

2.量表使用的目的与分类

(1)使用目的

量表的目的在于创造以定序、定距、定比形式测量变量的数字分数。量表常用在研究者想要测量一个人如何感觉或思考某事的情况下，有些人称它为感觉的硬度或效能。量表的使用主要有两个目的：第一，量表有助于概念化和操作化过程。量表显示一组指标与某个单一构想之间的符合程度。例如，研究者相信人们对某些特定政策如教育政策、住房政策所做判断的背后必然存在一个单一的意识类型维度，量表有助于决定人们在某些特定政策上的立场是否根据某一个单一构想，比如说，“保守主义/自由主义的意识类型”。⁽¹²⁾第二，量表产生定量测量，并可以和其他变量一起被用于检验假设。这样，量表就成为测量变量的一种技术。

(2)分类

在公共管理研究中，量表可根据它的测量内容分类。量表不仅用于测量人们的态度，它还用于测量人们的能力、智力、性格、工作成绩、社会地位、生活水平等，因而可分为态度量表、能力量表、智力量表、人格量表等类型。

量表还可以分为调查量表和测验量表，前者用于问卷调查中，后者则用于测验中。在问卷调查中，使用量表的主要目的是要精确了解总体的状况。例如，“政治态度”量表要将各类个人的政治态度统计汇总来了解各类人的政治态度，它的分析重点是群体而非个人，在设计上，量表题目较少，效度要求也不高。而测验中通常是要精确地测量个人的某一特征，如测验领导干部德才考核量表就是一种测量量表，它的分析重点是个人的能力和素质，量表设计就要严格、精确而且具有较高的信度和效度，这也需要设计大量的题目。

3.量表的主要形式

在具体实践中，量表可能以不同的形式出现。

①总加量表(Sunnated Rating Scales)。总加量表由一组对事物的态度和看法的陈述构成，回答者分别对这些陈述发表看法，然后，根据“同意”或“不同意”、“好”或“不好”等分别计分，再按某种标准将回答者在全部陈述上的得分加起来，这样就得到了该回答者对这一事物的态度的量化结果，它的高低代表了个人在态度量表上的位置。在回答范畴设置上，一般是两个以上。表4-2是一个总加量表的例子。

表4-2　公众对城市公交服务质量满意度量表

续表

计分办法：10个项目中：回答“很差”、“较差”、“一般”、“好”、“很好”依次计分为1、2、3、4、5。总数可能的最高得分为50分，表明公众对城市公交服务质量满意度最高。总数可能的最低得分为10分，表明调查者对公交服务质量满意度最低。

表4-2测量的是人们对城市公交服务质量所持的态度。它由10个陈述构成，将一个回答者对这10个陈述的得分相加，就得到了他在这个问题上态度的总得分。在这些量表中蕴含着一个潜在的假设：每项陈述都具有同等的效果，其分值是一样的，即它们在反映人们的态度方面是“等值的”，⁽¹³⁾不同的陈述之间分量是一样的，而无轻重之分。

②李克特量表(或称莱科标度，Likert Scale)。李克特量表是最简单的，也是适用最广的标度，在公共管理研究中极为常见。李克特量表在20世纪30年代由美国社会心理学家李克特(Rensis Likert)在原有的总加量表上发展出来，提供有关态度定序等级的测量工具。由于一个人在量表上的分数是以加总他回答的每个答案所具有的分数计算所得的，因此，李克特量表也称总和量表。其主要形式是询问答卷者是否同意某个陈述。由李克特量表又可以衍生出其他许多形式。以下列举使用李克特量表的一些实例。

罗森伯格的自尊量表

整体而言，我常觉得我是个失败者：

1.总是这么认为2.常常这么认为3.有时这么认为4.很少这么认为

5.从来就这么认为

我的主管对所有的下属都一视同仁：

1.从来不是如此2.很少如此3.有时如此4.经常如此5.一贯如此

我对目前食品安全现状的总体评价是：

1.非常满意2.满意3.一般4.不满意5.非常不满意

在实际应用过程中，我们常常遇到一些问题。

第一个问题就是设置几个回答范畴合适。李克特量表需要至少两个类别，如“同意”与“不同意”，“好”与“不好”等。但只用两个类别或选项只能创造一个比较粗略的测量工具，并且强迫回答者只做两种选择。我们认为使用4～8个类别或回答范畴比较合适，多于这个数目的差异就没有多大意义，反而会使人感到迷惑，对提高研究的信度也没有多大帮助。Nunnally说过，“当量表选项数目从2个增加到20个时，刚开始信度会增加得很快，不过大约到7个时，信度就持平了，大约到11个之后，增加选项个数对信度的增加不会有多少贡献”。研究者可以在资料搜集后，再进行类别的合并，但以粗略类别所收集的资料以后就无法变得更加精确了。我们可以在“同意”与”不同意”之外加上“非常同意”、“有点同意”、“极为同意”等类别来增加量表类别的数量，一方面给回答者较多的选择，另一方面还可区分出回答的强弱程度。同时，选项应该维持偶数平衡，或者说是对称的(如果中间加上一个中立的回答范畴如“不知道”等类似的回答则变成了奇数个)，例如，如果有“非常同意”、“同意”，就要有“非常不同意”、“不同意”。

第二个问题是在回答范畴内是否要设置“不知道”、“未决定”、“没意见”等回答范畴。对此，目前仍存在着有很大争议，赞成者认为这样可以不强迫答卷者对不了解或不愿意回答的问题表态，但少了这个回答范畴也可迫使一些答卷者认真思考，而不是随意填写。从统计的角度讲，加上这个答案可以拉开“同意”和“不同意”之间的距离，因此也是有益的。

如果量表中的所有项目都测量同一个概念，研究者经常把一系列李克特量表的题目合并成一个合成指数。我们看一个利用李克特量表来构造指数的实例，这个实例来自于Sniderrtman＆Hagen在研究中构造的妇女平等机会指数和自尊指数。⁽¹⁴⁾研究者将选项合并成一个指数，指数的可能分值为3～15，2是指数可能的最低得分，表示被访者感觉妇女机会是不平等的，15代表着指数可能的最高分，表示被访者感觉妇女机会是平等的。另外，对这个指数的计分是不加权的。如：

妇女机会平等指数：

问题：

1.与男性相比，妇女通过教育获取高层职位的机会较少。

①完全同意②有些同意③有些不同意④很不同意⑤不知道

2.许多有资质的妇女得不到好工作，具有同样技术的男性则较少遇到麻烦。

①完全同意②有些同意③有些不同意④很不同意⑤不知道

3.我们的社会歧视妇女。

①完全同意②有些同意③有些不同意④很不同意⑤不知道

计分办法：对于所有项目，“完全同意”赋值为1，“有些同意”赋值为2，“有些不同意”赋值为4，“很不同意”赋值为5，“不知道”赋值为3。

最后，为了避免答案形成定势，在使用多个指标测量同一个概念时，还可预设概念选项的方向(见下例)。答案定势也称答案类型或答案偏差，是由于一些人由于懒惰或心理因素，倾向于以同样的方式(一般是同意)回答大量的选项。在计算得分时候就得特别注意调整得分计算的一致性。例如Sniderrtman＆Hagen构造的自尊指数：

问题：

1.总的来说，我对自己是满意的。

①同意②不同意③不知道

2.我偶尔感觉自己不太好。

①同意②不同意③不知道

计分：项目1中，1代表“不同意”，2代表“不知道”，3代表“同意”；项目2中，3代表“不同意”，2代表“不知道”，1代表“同意”。指数可能的最高得分为6分，自尊心最高；指数可能的最低得分为2分，自尊心最低。

最后应注意的是，与总加量表不同的是：一是态度对比较明确，二是表明态度的层次性，三是可分为五类，并赋予相应的值，即非常同意(非常赞成)、同意、无所谓、不同意、非常不同意。

李克特量表的优点在于简单与容易使用。把多个题目加以合并之后，就可产生更具有全面性的多重指标测量。但该量表也有不足，一是以不同的方式合并数个量表题目可能产生相同的整体分数或结果，二是回答组会是一个潜在的危险因子。

③语义差异量表(Semantic Differential)。语义差异量表是在20世纪50年代发展并应用的，它为我们提供测量人们对某个概念、物体、其他人的感觉的一种间接测量工具。语义差异量表利用形容词来测量对某些事物的主观感觉，并且大多数形容词都具有反义意义词，如亮与暗、快与慢、硬与软等。使用反映被评测事物含义的一些对立形容词就可以建构出一个量表。使用语义差异量表的目的很多。如在市场研究中，语义差异量表可提供消费者对某种产品感觉的信息，政治顾问可用它来发现选民对某个候选人或某个议题的看法，精神治疗者可用它来判定病人如何理解自己等。

标准的语义差异量表包含一系列形容词及其反义词，在每对形容词与反义词之间有7～11个连续点，受试者在对立形容词之间的连续点上标出可以表达它感觉的位置。从语义上说，这些形容词大致分为三类，一是表示评价，如好与坏；二是表示力度，如强与弱；三是表示行动，如主动与被动。其中，评价通常最为显著，也是使用最广泛的一类。最后研究者要用统计程序来分析受试者对这个概念的感觉。以下是语义差异量表的实例。

请阅读下列成对的形容词，然后在空白处圈出你第一印象的感觉。你的回答没有对错之分。

你对离(结)婚的看法如何？

不好的×　　　　　　　　　　　　　　好的

深刻的　　　　　　　　　　　　×　　肤浅的

脆弱的　　　　　　　　×　　　　　　强烈的

公平的　　　　　　　　　　　　　×　不公平的

安静的　　　　　　　　　　　　　　×吵闹的

现代的　　　　　　　　　　　　　　　传统的

简单的×　　　　　　　　　　　　　　复杂的

快速的　　×　　　　　　　　　　　　缓慢的

肮脏的　　×　　　　　　　　　　　　干净的

语义差异量表所得的结果告诉研究者，人是如何感知不同的概念，或不同的人如何看待相同的概念的。政治分析家可能会发现年轻的选民认为他们的候选人比较传统、软弱、迟钝，好坏参半；年长的选民则倾向于认为这种候选人比较强势、动作快、优秀，并且介于传统与现代之间。

使用该量表时应注意两个问题：一是多组形容词的安排不能形成固定的模式，如把褒义的放在一边，而贬义的放在另一边，避免答卷者觉察出模式，而不假思索地把所有的答案集中在一边。二是尽可能全面地包含概念、事物、人的各个层面。

鲍格达斯社会距离量表由鲍格达斯在20世纪20年代发展出来，用以测量不同民族团体成员愿意与其他民族结合的意愿，即对某一群体对某个目标以外团体所感觉到的距离的测量。该量表可用来测量人们对某些其他团体如宗教少数团体或偏差团体感觉到的亲疏程度，⁽¹⁵⁾以及人们对其他族裔的容纳程度。这种量表事先有个假定，即会拒绝社会接触或会对社会距离较远感觉不舒服的人，将会拒绝社会亲密度较高的题目。

在公共管理研究中，这种量表的一般形式为：首先列出5～9个带有顺序的陈述句(或称指标)：来自某个团体的X进入你的国家、进入你的城镇、在你的公司里工作、住在你隔壁、成为你的好朋友、与你的兄弟姐妹结婚(一般地，在这些陈述句中，要把最具有威胁性或有最大社会距离的陈述句放在一端，把最没有威胁性或社会亲密度最高的陈述句放在另一端)。然后，询问他是否对这些陈述句中的状况感到舒服，或者问他是否这些接触都是可以接受的，也可以问他是否会对这些关系感到不自在。研究者常要求人们回答这些陈述句或者让他们继续阅读这些陈述句，直到他们对某种关系觉得不舒服为止，例如：

研究者要想发现城市中学生对来自农村的借读生的社会距离是怎样的，设计了下列问题：

如果有一个来自农村的学生，与你有以下接触，你个人是否觉得自在，请给出最直接的反应，是或否。

_1.到你的学校做一个星期的访问学生

_2.在你的学校注册入学，做全职学生

_3.与你选修相同的数目课程

_4.在课堂上坐在你的旁边，和你一起准备考试

_5.和你住在宿舍的同一层楼隔壁几间的房间内

_6.和你一起住在学校宿舍，成为室友

_7.和他(她)成为恋人

从逻辑上看，这七个指标之间是密切关联的，呈递进的顺序结构，每个指标都建立在前一个指标之上，并可相互检验。后一问题以前一问题为基础，问题范围由大到小。该量表浓缩了数据，在该量表上，1的得分，就代表着2～7这六个数字所表达的意思，2的得分就代表了3～7这五个数字的意思。因此，这是一个很经济的量表。

社会距离量表是一个判断被访者感觉某个社会团体亲密程度的便捷方法。但它也有一些限制：如研究者需要为某个外团体与社会背景制作专门的回答类别，对研究者而言，比较被访者对数个不同团体的感觉不是件容易的事情，除非被访者在相同的时间内完成对所有外团体的社会距离量表。

4.小结