首页 百科知识 问卷设计和数据收集

问卷设计和数据收集

时间:2022-05-20 百科知识 版权反馈
【摘要】:一、变量的测量调研问卷的设计包括小规模访谈、问卷前测、修正问卷几个过程。所谓信度,是指调查结果的可靠性程度。将原先的假设3、4、5合并为一条假设,即假设无论正面还是负面口碑,网络口碑的效力正向影响其可信度,则前测后的研究假设见表6-10。本研究主要是针对消费者网络购物过程中网络口碑可信度对其心理和购买意愿的影响进行研究。

一、变量的测量

调研问卷的设计包括小规模访谈、问卷前测、修正问卷几个过程。在文献回顾的基础上,结合我国消费者的特征,对各个变量的度量项目进行了设计。问卷包括个人信息和变量度量信息两个部分内容,度量项目采用李克特(Likert)七级量表,模型中8个变量共包括32个度量项目。变量及量表见表6-2。

表6-2 本研究变量及量表

续表6-2

二、变量的前测

一般在形成正式问卷前,都需要通过信度(Reliability)和效度(Validity)两个指标对量表进行前测(Pretest),在这一过程中,可以对相关变量的测量项目的有效性进行甄别,对问卷的题项设置的科学性、合理性进行检测。

所谓信度,是指调查结果的可靠性程度。常用的信度测量采用内部一致性信度(Internal Consistency Reliability)。在实际应用中,通常采用克隆巴赫α(Cronbach'sα)系数来检测测量项目的内部一致性。根据大多数学者的观点,一般量表的Cronbach'sα系数达到0.8以上时,就可以说是相当好;信度系数达到0.7以上则是较好;0.6以上则为可以接受的信度。

效度是指测量结果与试图达到的目标之间的相近程度。在效度分析时,一般关注主测量项目的内容效度和结构效度。

内容效度是指量表的测量项目与测量目的是否相符。内容效度的判断方式是看量表是否能真正测量研究者所要研究的变量。与表面效度这种主观判断的效度不同,内容效度需由多名专家来判断测量项目与预测变量在内容上是否一致。

结构效度也被称作建构效度,是指一个量表能实现研究者编制量表的理论构想的程度。结构效度一般从收敛效度(Convergent Validity)和区分效度(Discriminant Validity)两方面进行测量。

本研究采用探索性因子分析(Exploratory Factor Analysis,简称EFA)方法对于测量项目的结构效度进行评估。在做因子分析之前,需要使用样本充分性KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测试系数来检验数据是否适合做因子分析。一般认为KMO的值不应低于0.5,越接近于1越适合做因子分析。巴特利特(Bartlett)球体检验(Bartlett Test of Sphericity)用来验证各变量间的彼此独立性,Bartlett统计值达到显著性概率0.05时,适合做因子分析。

适合因子分析的再通过主成分分析(Principle Component Methods)法进行因子分析。[3]

问卷的前测通过发放问卷星网站在线问卷的链接和纸质问卷两种方式,发放纸质问卷50份,收回有效问卷35份;收到有效网站问卷13份,共收回48份有效问卷,并通过SPSS 17.0软件对数据进行信度和效度分析。

(1)信度测量结果。

量表中的9个变量信度系数(Cronbach'sα)最小0.740,最大0.924(见表6-3),均表明度量项目均有较高的可信度。

表6-3 量表前测信度检验结果

(2)结构效度测量结果。

对消费者个体特性、消费者感知、中介变量及购买意愿几个构面进行效度检验,每组的KMO检验值均大于0.7,且Bartlett球体检验显著,适合做因子分析。通过探索性因子分析(主成分分析经Varimax旋转),结果见表6-4、表6-5、表6-6、表6-7、表6-8、表6-9。

表6-4 消费者个人层面量表前测效度检验结果

表6-5 旋转成分矩阵

表6-6 口碑信息层面量表前测效度检验结果

表6-7 旋转成分矩阵

表6-8 中介变量及购买意愿层面量表前测效度检验结果

表6-9 旋转成分矩阵

从旋转后的成分矩阵中,我们看出消费者个人层面和中介变量(因变量)这两组的数据表现良好,各个变量的收敛效度非常理想,每个变量的所有测量指标都各自集中在相应的公因子上,且各问项因子载荷都高于0.6,具有较好的一致性。在口碑信息层面的变量测量中,我们发现口碑数量、口碑质量和口碑时效均集中在一个公因子上,说明三者的区分度不高。为方便和简化研究,本研究将口碑信息的三个变量合并为一个变量,即口碑效力。本研究将口碑效力定义为口碑由于质量、数量和时效性的影响而表现出的效果强度。相应地将原模型略为改动(见图6-2),原有的10个假设就变为8个假设。将原先的假设3、4、5合并为一条假设,即假设无论正面还是负面口碑,网络口碑的效力正向影响其可信度,则前测后的研究假设见表6-10。由于并没有增加、删除变量或是修改路径,符合结构方程(SEM)分析的模型改动规则。原有的10项假设也变为8项假设,原有的8个变量也变为6个变量,对应问项数量32个,加上甄别和背景问项7个,正式问卷共有39个问项。

图6-2 修改后的概念模型

表6-10 前测后待检验的假设汇总表

三、数据收集及描述性统计

通过便利抽样的方式,本研究采用如下渠道来获得样本数据:一是将问卷放置于问卷星网站上(www.sojump.com,问卷问卷ID1227138),让进入该网站的网民可以直接打开问卷网页进行问卷填答;二是通过个人加入的群、空间、社区等向网友发送问卷填写链接,辅以简单的说明,鼓励网友积极参与填写并利用自己的网络关系发送更多的问卷链接。

本研究主要是针对消费者网络购物过程中网络口碑可信度对其心理和购买意愿的影响进行研究。没有特别限定调查对象的年龄、职业和性别等,但需要调查对象符合以下两个基本要求:一是受访者必须能够独立操作计算机浏览互联网;二是受访者必须有网络购物经验。

确定样本量的大小是抽样过程中最为复杂的问题之一。究竟需要多大的样本量,才能使研究结果在一定的置信水平下,达到一定的精度水平?一般来说,研究所需样本的容量大小与下列因素中的一项或多项有关:①研究类型;②研究目的;③研究复杂性;④容许误差;⑤研究时间;⑥研究经费;⑦在同一研究领域,已完成的研究中可参考的样本量。在使用结构方程模型(SEM)理论估计和解释变量时,样本规模对最终结果会产生一定的影响,一般要求样本量在200个。戈萨奇(Gorsuch,1983)认为测量问项与样本数的比例应保持在1∶5以上,最好达到1∶10。

本次问卷调查从2011年12月开始,为期2个月,共收回问卷271份。网上问卷调查采用IP地址作为判断被试填答次数唯一性的检验条件,因此,可以防止一个被试多次填答给调查结果带来可靠性偏差的问题。

由于被访者是通过网络填写问卷,问卷星网站系统限定有漏答题的问卷不能提交,所以获得的样本不存在漏答的无效问卷,但我们可以通过调查问卷中隐含的逻辑关系来对问卷的有效性进行分辨,剔除明显不认真填写的问卷。例如有些问卷几乎所有的题目都选择一个分点作答。还有的问卷出现前后逻辑矛盾,经过清理,发现这样的问题问卷有34份,以无效问卷处理,予以剔除。最终获得有效问卷237份,问卷有效率为87.4%。本研究共有32个研究问项(另外还有7个个人信息及网购基本情况问项),研究样本数为237个,问项与样本的比例大概为1∶7.4,超过1∶5的最低标准,说明本研究的样本容量符合结构方程模型和研究目标的需要。

基本统计分析是数据的分析基础和起点。通过基本统计分析,研究者能对所获得的研究数据的基本统计特征有大致的了解,从而可以从整体上把握数据的分析特征。

表6-11显示了样本的个人信息统计结果,该样本中男女的比例分别为31.6%和68.4%,这是由于本人所任课的班级中女生比例稍大于男生;另一所高校的被调查学生专业为新闻传播学和播音主持专业,女生比例也明显高于男生。由于样本大都是高校学生,所以年龄大多在20岁左右。在教育程度上,本科生占到大多数,为86.9%,这也不难理解没有月收入样本的比例有89.5%之高。

表6-11 调查样本的个人信息统计结果

最终样本是删除了没有网购经历的样本数据,表6-12是整个样本的网络购买行为及口碑接触情况的统计,其中还包括被调查者最近一次网络购物中接触的口碑信息方向。从数据显示上观察,被调查者并没有因为没有收入或者收入有限而减少网购;相反的,网购频繁的人数占到30%,只有为数不多的7.6%的人很少网购。被调查者中网购最大单笔金额大多数在500元以下,占76.8%,千元以上的也有近10%的比例。对于口碑信息的关注度让笔者更加觉得选题研究的价值和意义所在。我们发现,大部分的网购者都非常关注口碑信息,选择“总是关注”的人数占到了53.6%,高的关注度预示着其对消费者行为在一定程度上有影响,具体的影响机制我们还要通过进一步的数据分析来实现。被访者最近一次接触的网络口碑(消费者评论)为正面信息的有211人,负面的有26人,分别占总样本人数的89%和11%。

表6-12 样本的网络购买行为及口碑接触情况的统计结果

测量指标的描述性统计主要包括每个观测变量的最小值、最大值、均值、准差、偏度、峰度等信息。最小值与最大值反映了被调查者答题的差异性。偏度、峰度等信息反映了样本数据的分布情况。因为本研究在后面的研究中主要用到AMOS软件,而AMOS模型的前提假设有两条:其一是线性关系;其二是观察值独立,即样本的选取是随机的,观察变量必须满足正态分布的要求。关于偏度系数(Skew)与峰度系数(Kurtosis)的标准如下:当偏度系数大于3、峰度系数大于8时需要注意;如果峰度系数大于20时,则需要密切注意了,表明某些变量呈现出非正态分布。违反多变量正态分布的条件会导致高估X2值及低估参数估计值的标准误(荣泰生,2009)。

本研究的主要观测变量的描述性统计分析结果见表6-13。

表6-13 本研究的主要观测变量的描述性统计分析结果

续表6-13

由表6-13可以看出,变量的极大值都是7,极小值都是1,表明受访人员对问项的回答具有较大的差别。再从均值、标准差、峰度、偏度的得分情况来看,在正态分布时,偏度系数与峰度系数均要接近于0。在表6-13中,偏度系数最大的为负的1.260,峰度系数最大的为1.013,均远小于上面所说的临界值。而且均值中等(最小为4.11,最大为5.68),标准差小(最小为1.454,最大为1.044),表明这些测量指标接近正态分布,同时说明受访人员对这些指标打分的波动幅度较小。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈