首页 理论教育 调查设计及执行情况

调查设计及执行情况

时间:2022-03-17 理论教育 版权反馈
【摘要】:根据中日双方商定,本次调查的初级抽样单位是大连、上海、成都和南宁四个城市。调查对象是四地市辖区内年龄在30到75岁之间的城乡居民。表1.1.3列出了被调查人家庭成员的年龄构成。
调查设计及执行情况_变迁中的城乡家庭

三、调查设计及执行情况

本次调查是1983年“中国五城市婚姻家庭研究”、1993年中国社会科学院重点科研项目“中国七城市婚姻家庭研究”和1999年中日合作项目“现代中国城乡家庭研究”的继续。调查的目的在于收集研究城乡家庭变迁和进行东亚各国,主要是中、日、韩三国婚姻家庭比较研究的资料。因此,本次调查问卷设计既要考虑前两次调查的可比性,也要考虑到与日本和韩国有关调查的可比性。所谓可比性主要体现在以下两个方面:

(1)本次调查关于家庭的理论和操作定义与前几次调查完全一致。确切地讲,本次调查中家庭的概念是指由有婚姻和血缘关系(包括领养、过继)的人组成的共同生活的群体。其中也包括两地分居的配偶,还包括因上学而离家但仍受家庭供养的子女。对共同生活这一概念,未做客观的操作规定,由回答人主观认定为依据。它与以往的调查完全一致。

(2)为了使调查资料具有时序和跨文化意义上的可比性,问卷题项的选择,首先考虑跨文化的可比性———考虑与日、韩两国,尤其是与日本近期进行的有关调查的可比性,即尽可能地把两国近年进行的有关调查(全日和全韩家庭调查)的内容包括进来。其次则要考虑时序上的可比性———和我们自己以往进行的调查的可比性。限于篇幅,我们不准备在这里对问卷的内容做过多的介绍,对它感兴趣的读者,可参见本书附录中收录的本次调查的问卷和有关说明。

在这里我们想给读者做一点说明的是问卷的结构。本次调查的问卷从计算机数据文件角度看,属于一种多重记录型的结构。问卷收集的数据不仅包括回答人本人,同时还包括回答人的家庭成员、非共同生活的子女,男方非共同生活的父母和兄弟姐妹及女方非共同生活的父母和兄弟姐妹。除了回答者本人的数据是单记录的,其余数据不仅是多重记录的,且记录的条数是随机的。这样的设计无疑将大大增加信息量,有利于对家庭结构、家庭关系和家庭网络的研究。万事万物,有一利则必有一弊———这样的结构在增加了信息量的同时,使调查的难度和数据分析与处理难度也大大增加了。

根据中日双方商定,本次调查的初级抽样单位是大连、上海、成都和南宁四个城市。调查对象是四地市辖区内年龄在30到75岁之间的城乡居民。四市的样本量除成都为2 400个外,其余城市的样本量都是800个。四个城市的总样本量是4 800个。总样本量是根据沈崇麟主持的中国社会科学院重大项目《中国城乡社会变迁》调查的抽样方案设定,该调查的初级抽样单位是大连、上海、成都、兰州、广州和南宁。调查对象是六市市辖区的城乡20岁以上的居民。每市样本量均为800人(户),共4 800人(户)。同时这也是中日双方最初商定的各初级单位和总样本的样本量。后应日方要求,改为目前的方案。这一方案舍去了原方案中的两个初级单位———兰州和广州,并把原属该两地的样本量都分配给了成都,致使成都的样本量为其他三地的3倍。此外对象年龄的下限也由原方案的20岁提高到30岁。理由是两年前(2004)年进行的全日家庭调查的调查对象的年龄下限是28岁,两年后,这批人的年龄已经30岁,为了便于进行中日比较,日方提出将本次调查对象的年龄下限设为30岁。根据本次调查抽样设计的这一性质可知,虽然本次调查的数据还是适于做初级单位之间的比较研究,但由于成都的样本量是其余三地样本量的三倍,因此严格地讲,在分析时不考虑各市人口总量的差别,仅就样本量本身而言,可能也需要加权。从抽样设计看可用每一调查地的人口数作为权数,但成都的权数需要乘以1/3,因为它的样本量是其余三地的三倍。由于本书的结构,是由一篇基于总样本的总报告和基于每一调查地样本数据的分报告构成的,为避免总报告和地方报告之间的分析结果因加权而引起的差异,总报告也未对数据进行任何加权。这一点请读者注意。也就是说,文中所有数据都是未经加权的数据,因此在各地数据有明显差异时,总计数据的使用需特别小心,因为它会明显偏向成都的数据结构

在初级单位以下,采用的是分层(城乡)的PPS不等概多阶段抽样。大连、上海、南宁是按照区、街道(乡镇)和居委会、家庭四级抽样。因为成都市的样本量是2 400,所以总体是包括了城区和郊区的全部区。在实施抽样中,因一个郊区不予配合(新都区),才改用经济发展水平和交通与该区相似的双流县。前三级抽样都是按照人口比例进行的不等概率抽样,居委会是按照分配的户数进行的抽样。设计的抽样结果见表1.1.1。

表1.1.1 调查样本的分布情况

img1

但是在实际的调查过程中,由于调查员的疏忽或被调查人年龄确定上的实际困难,在最后的调查结果中,有243名被调查人的年龄小于30岁(1978年及以后出生)和37个被调查人年龄在75岁以上(1931年及以前出生)(这里和本书其余部分的年龄计算方法是“2007年-出身年”)。在数据处理的时候,我们考虑到这280份问卷填写比较完整,也有分析利用的价值,因此,将它们也送入了计算机中,致使最后的总样本量为5 072个。被调查人的年龄结构如表1.1.2所示。

表1.1.2 被调查者的年龄分布

img2

从上表的数字可知,本次调查的全部四个城市中,比例最高的都是中年的被调查人,但是差别在于上海61岁以上的老年被调查人大大高于其余三地。这可能是因为上海人口的老龄化程度是四个城市中最高的缘故吧。

在上面的有关研究设计的介绍中,我们已经知道,本次调查不仅涉及被调查人本人,而且还涉及被调查人的家庭。本报告分析的数据不仅涉及被调查人本人,也涉及被调查人的家庭,甚至被调查人的亲属。如本报告中有关家庭结构、家庭收入及家庭关系的论述就涉及了被调查人的家庭和亲属。为了便于读者了解这部分数据的结构和质量,我们在给出被调查人的每一人口学特征分布的同时,同时也给出被调查人家庭成员的相应分布。表1.1.3列出了被调查人家庭成员的年龄构成。

表1.1.3中的年龄计算方法与表1.1.2相同,但因为家庭成员实际上是四个调查地总人口的样本,与被调查人不同,它的年龄范围并不受30~75岁的限制,因此我们采用了5岁一组的全等距分组。若将上表数据稍作归并,分成老(60岁及以上)、中(35~59岁)和青(34岁及以下)三组,三组比例最高的都是中年,都在45%左右。其次都是青年组但各地的差异比较大,最高的南宁为40.32%,最低的上海仅为29.21%,两地的差异高达在10%以上。无独有偶,四地比例最低的都是老年组,但差异也较大,最高的上海25.77%,而最低的南宁仅为14.68%,差异也在10%以上。四地的人口结构都已不再是金字塔形。下面我们再来看一下本次调查的性别分布,如表1.1.4和表1.1.5所示。

表1.1.4数据显示,成都和南宁的被调查人性别分布比较均衡,女性略高于男性。而大连和上海,则女性被调查人明显高于男性,其中大连女性比男性高出了将近20%,上海也高出了12%以上。两地的样本从性别分布上看,存在一定偏倚。但是家庭成员的性别分布看,四地样本都还是比较均衡的。

表1.1.3 被调查人家庭成员年龄分布

img3

表1.1.4 被调查人的性别构成

img4

表1.1.5 被调查人家庭成员性别构成

img5

表1.1.5数据显示,四地家庭成员的性别分布,男女基本上各占50%。也就是说从抽样的角度看,与回答人的样本比,家庭成员样本的抽样误差更低。

调查实施工作从2006年9月开始,到2007年4月结束。为保证调查的对象符合规定,各地严格执行调查规定。除了当地的督导进行问卷检查外,课题组的主要负责人也对四地调查进行了检查,对于调查中出现的问题及时给予了指导。调查过程得到了当地居委会的配合,除了部分调查对象拒访外,抽样名单基本得到完成。同时补充的个案都是抽样后备名单中的对象。但各地的实施时间和居委会的配合程度不同,最后的成功率也不同,四地调查成功率见表1.1.6。

表1.1.6 各城市调查成功率

img6

注:因原资料不完整(未成功的人数不完全),上海的成功率是参照大连估计的。

未成功的主要原因是选定的被调查对象拒访和在调查时不在调查地。

以往的调查,样本的城乡比例的分配都依照调查时调查地的居民户籍的“农”与“非农”的比例来确定。但是近年来,由于户籍制度的改革,比如成都市的城乡一体化,加之行政区划的巨变,如成都市原来的新都县改为了现在的新都区,因此,“农”与“非农”的比例很难再作为城乡构成的依据了。所以经考虑,本次调查仍然采用2001年我们在这四个城市做的城乡结构社会变迁调查时使用的城乡构成比,以居委会的居民作为城市居民,将村委会的居民视为农村居民。为了便于分析,我们生成了一个新的变量,即a15(1.市民;2.村民)。所以本次调查的城乡构成如表1.1.7所列。

表1.1.7 调查对象城乡分布

img7

四个城市中上海的市民比例最高,达到了82.57%,成都最低,仅为60.24%。四地调查对象在城乡分布上的差异实际上是四地的城市化程度差异的反映。它与表1.1.8所列的家庭成员的城乡分布是基本上一致的。

表1.1.8 家庭成员城乡分布

img8

四地家庭成员的城乡分布和被调查人的城乡分布在结构上是一致的。只是家庭成员表中的城市比例都低于被调查人,而农村比例则都高于被调查人,这是因为农村的家庭人口多于城市之故。因此,从人口的角度看,家庭人口的城乡分布,应该更接近四地总人口的城乡分布。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈