第二节 广交会正式样本的聚类分析
一、广交会正式样本的聚类数目
聚类分析的目的是要对研究对象进行分类,因此如何选择分类数成为聚类分析中的主要问题之一。在K-Means聚类分析法中,聚类之前需要指定分类数,如何确定类的最佳个数是本节要解决的第一个问题。
确定分类数的问题是聚类分析中迄今为止尚未完全解决的问题之一,主要的障碍是对类的结构和内容都很难给出一个统一的定义,这样就给不出从理论上和实践中都可行的虚无假设。实际应用中人们主要根据研究的目的,从实用的角度出发,选择合适的分类数。
大量的基于旅游和节事影响感知的居民聚类研究(参见表2-2和表2-3)表明,聚类数目一般设定为2~5类。运用SPSS 15.0统计分析软件,分别以2类、3类、4类和5类为聚类数目进行了4次尝试性聚类,通过比较类中心距大小及类中心值的可解释性,本研究最终认为将广交会样本的聚类数目定位3类是较合适的。
二、广交会正式样本的聚类分析结果
在SPSS 15.0中引入聚类分析的3个变量(即第三章因子分析中的3个公因子),选择K-Means聚类分析法,将聚类的数目(Number of Clusters)设为3类,最大迭代次数设定为20次,得到的输出结果如表4-1~表4-7所示。
表4-1是初始类聚心表,表中列出了由系统给出的各类的初始聚类中心。
表4-1 初始类聚心表
表4-2是迭代史表,表中列出了迭代过程中各类聚心的演变。表下的注释指出聚类过程经过16次迭代才终止,初始聚类中心之间的最小距离为5.760。
表4-2 迭代史表
续表
a.Convergence achieved due to no or small change in cluster centers.Themaximum absolute coordinate change for any center is0.000.The current iteration is16.Theminimum distance between initial centers is 5.760.
表4-3所示是最终聚类中心表,表中列出了各类的最终聚类中心。由于在聚类分析中输入的3个公因子是标准化分数,因此表4-3中的数据也是标准化分数。为了直观地显示最终聚类中心在各个公因子上的原始得分(即5分制),利用标准化计算公式:
Zi=(Xi-X)/S
式中,Xi为变量x的第i个观测值,X为变量x的平均数,S为标准差。Zi表示一个变量值与该变量的平均值之差是标准差的倍数,即标准化分数。将该式变形为: Xi= Zi×S+ X,即可根据标准化分数求出原始分数(均值及均值标准差参见表3-8)。表4-4中的数据是根据表4-3的标准化分数求出的原始分数。
表4-3 最终聚类中心表
表4-4 用原始分数表达的最终聚类中心表
表4-5所示是每类中的样本数目表,表中列出了每个类中的观测量数目,以及有效观测量数目和缺失观测量数目。在715个有效样本中,属于类别1的居民有210人,属于类别2的居民有197人,属于类别3的居民有308人。
表4-5 每类中的样本数目表
为了进一步命名居民类别,以及分析3个类别居民的社会人口统计学等特征,运用了SPSS中的列联表分析。在列联表的行中输入各个人口统计学等变量,在列中输入聚类分析代表3个类的新变量,分别得出列联表统计的数据摘要表,如表4-6所示。
表4-6 列联表统计的数据摘要表
需要说明的是,由于有11个人口统计学等变量,因此执行了列联表分析(即Crosstabs)后,实际上输出了11个表格。为了简明体现不同类型居民的人口统计学特征,将11个表格整理合并为表4-7。
结合表4-4、表4-5和表4-7,即可简要说明3个居民类型的名称,以及各个类别的居民在11个独立变量上的具体特征。
表4-7 3个类型居民的社会人口统计学特征
续表
(一)类型1:关注自我的谨慎支持者
即表4-4中的第2列。这类居民对公因子1“社区收益”的评分均值是2.90693,对公因子2“成本感知”的评分是3.92638,对公因子3“个人收益”的评分是3.93745。可见,这类居民同意广交会为他们带来“促进文化交流”、“提高语言能力”和“增加文明程度和好客度”等个人收益,而对广交会为社区带来的收益持中立态度。另外,他们对广交会的“成本感知”评分与“个人收益”评分接近,说明他们在赞同广交会带来个人收益的同时,也清醒地认识到广交会造成的社会成本。这表明,对于广交会而言,这类居民是关注自我的谨慎支持者。这类居民有210人,占有效样本(n= 715)的29.37%。
从人口和社会学特征的统计值来看,这类居民主要有3个特点:第一,女性的比重比其他两类都大,达到57.9%;第二,居住年限在15年以上的居民占该类别总数的39.4%,在三个类别中居住年限最长;第三,以企业职员、事业单位人员和学生群体为主。另外,该类别中20~45岁的居民占85.7%;高中及以上文化程度的居民比重占98.5%;月收入在1000~5000元的占68.5%;居住地以天河区和越秀区为主;居住地距离琶洲会展中心的车程在11~60分钟的居民占78.6%。此外,这类居民中的大部分人既不为广交会和相关行业工作,与参展者的接触也不多。
(二)类别2:积极支持者
即表4-4中的第3列。这类居民对公因子1“社区收益”的评分均值是3.75805,对公因子2“成本感知”的评分是2.58243,对公因子3“个人收益”的评分是3.24945。这类居民同意广交会带来了社会收益,对广交会是否带来个人收益持接近中立的态度,但是他们对广交会的成本感知在3个居民类别中是最弱的。这表明,他们在感知到社会收益的同时,没有明显感觉到成本因素,因此,可以称之为积极支持者。这类居民有197人,占有效样本(n= 715)的27.55%。
这类居民的主要特点是公司职员比例在3个类别中比例最高。由于广交会属于贸易型的展览会,公司职员从中获利的可能性最大,因此,在积极支持者类别中公司职员的比例最大是合乎逻辑的。另外,女性居民占该类居民中的50.3%;年龄在20~45岁的居民占94.9%;高中以上文化程度的居民占97.2%;月均收入在1000~5000元的居民占92.7%;这类居民以天河区和海珠区的居民为主;居住年限在15年以上的居民占23.2%;居住地距离展馆11~60分钟的居民占75.0%;大部分居民既不为广交会和相关行业工作,与参展者的接触也不多。
(三)类别3:关注社区的谨慎支持者
即表4-4中的第4列。这类居民对公因子1“社区收益”的评分均值是4.27255,对公因子2“成本感知”的评分是4.08728,对公因子3“个人收益”的评分是3.45276。这类居民在“社区收益”和“成本感知”两个公因子上的评分,在3个类别中均为最高。相对而言,他们是最强烈感知社区收益和成本感知的居民群体。他们同意广交会为广州的国际化大都市形象、市容和公共设施维护做出了巨大贡献。同时,他们又认为广交会使得广州的不良行为增加、房价和租赁成本上涨以及噪声和垃圾增加。他们对于从广交会的个人获益方面保持了中立态度。因此,将这类居民命名为关注社区的谨慎支持者。在广交会样本中,这类居民的人数最多,有308人,占有效样本(n= 715)的43.08%。
从11个独立变量来看,类别3的主要特点是主要由天河区和广州其他区居民构成,有56.5%的居民来自上述地区。这些地区不是广交会展馆的所在地,居民对广交会的认知可能相对比较抽象,因此侧重于对“国际化大都市形象”、“广州市容”和“公共设施”等社区方面的关注。另外,该类别中的女性比例是52.1%;年龄在20~45岁的居民达90.9%;高中以上文化程度的居民占该类别居民人数的97.6%;主要由公司职员、事业单位人员和工人构成;月均实际收入在1000~5000元的居民占70.6%;在广州居住年限超过15年的居民占该类别居民人数的25.3%;居住地距离琶洲展馆的车程在11~60分钟的居民占83.6%。与前两个类别一样,类别3中的大部分居民既不为广交会和相关行业工作,与参展者的接触也不多。
三、小结
对广交会正式样本的聚类分析结果表明:第一,样本中的广州居民对于广交会总体上是持积极态度的,这在一定程度上表明广州居民对广交会的收益感知大体上强于成本感知。第二,必须注意到样本中有72.45%的广州居民对广交会持谨慎支持态度。这部分广州居民的态度实际上是比较微妙和不坚定的。这体现在他们的个人收益和社区收益感知的均值得分都是在4分左右,距离“强烈同意”仍有一定距离,而成本感知的均值得分也在4分左右,距离“强烈同意”的分值并不太远。一旦他们的收益感知减弱,成本感知增强,便有可能会转变为广交会的中立者甚至反对者。第三,即使是类别2“积极支持者”,实际上他们之所以被这样命名,主要是因为他们的成本感知较弱,而个人收益和社会收益感知的均值得分并不太高。
总之,从广交会正式样本来看,没有理由对广交会的社会影响持盲目乐观的态度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。