首页 理论教育 与汉语存在表达方式差异的例子

与汉语存在表达方式差异的例子

时间:2022-02-27 理论教育 版权反馈
【摘要】:首先,将录音转写为文本形式后使用分词软件进行分词,然后对分词后的语料进行人工检查。同时根据《汉语水平词汇与汉字等级大纲》把词汇分为甲级词、乙级词、丙级词和丁级词,不属于上述几个级别的划归为超纲词。下面我们通过方差分析和多重比较来进一步考察上述差异是否具有统计学意义。下面我们进行统计分析进一步说明。

2.4.1 分析指标和编码

首先,将录音转写为文本形式后使用分词软件进行分词,然后对分词后的语料进行人工检查。同时根据《汉语水平词汇与汉字等级大纲》把词汇分为甲级词、乙级词、丙级词和丁级词,不属于上述几个级别的划归为超纲词。

然后,统计每个被试所使用的不同级别的词语的个数(以下简称“type”)和用词总数(以下简称“token”)。

最后,给每个被试所使用的词语进行词性标注,统计每个被试所使用的不同级别的名词和动词的types和tokens,并依据公式U =(lgtypes)²/(lgtokens-lgtypes))进行名词和动词复杂性的计算。

2.4.2 结果与分析

表1列出了不同汉语水平的留学生和汉语母语者在叙述时所用的不同词汇等级的词语的U值。从表1的平均数我们大体可以看出,不管是汉语母语者还是学习汉语的留学生,他们更多地使用甲级词,同时都有不少数量的超纲词;对于汉语母语者来说,乙级词也是他们常用的词语,而对于汉语学习者来说,乙级词的使用明显比甲级词少,但是高级汉语水平的留学生对乙级词的使用虽然与汉语母语者存在差距,但是比初、中级学习者使用更多。下面我们通过方差分析和多重比较来进一步考察上述差异是否具有统计学意义。

表1 汉语学习者和汉语母语者在叙述故事时所使用的不同等级的词语的U值和标准差

对不同汉语水平的学习者在叙述过程中词语使用的复杂性U值进行5(词汇等级:甲级、乙级、丙级、丁级、超纲)×4(被试群体:初级、中级、高级、母语者)两因素混合设计的方差分析,结果发现:

词汇等级的主效应显著F(4,464)= 378.52,p<.001,被试群体的主效应显著F(3,116)= 31.04,p<.001,词语等级和被试群体之间的交互作用显著F(12,464)= 4.54,p<.001。进一步简单效应检验发现,在每一个词汇等级上,被试群体之间的差异都显著,具体来看:

在甲级词的使用上,被试群体之间差异显著F(3,116)= 2.86,p<.05,但事后多重比较(Sidak法矫正)发现,群体两两之间的差异均不显著(ps>.1),只有初级水平的汉语学习者和汉语母语者之间的差异边缘显著(p = .065)。

在乙级词的使用上,被试群体之间差异显著F(3,116)= 26.04,p<.001,事后多重比较(Sidak法矫正)发现,除了初级和中级汉语水平的学习者之间的差异不显著外(p>.1),其余各组之间的差异均两两显著(ps<.05),也就是说高级汉语水平的学习者对乙级词的使用比初中级汉语学习者多,但是没有汉语母语者那么多。

在丙级词的使用上,被试群体之间差异显著F(3,116)= 30.88,p<.001,事后多重比较(Sidak法矫正)发现,汉语母语者对丙级词的使用远远多于三组汉语学习者(ps<.001),三组学习者之间,初级和高级水平的学习者之间的差异边缘显著(p = .076),初级和中级、中级和高级之间的差异均不显著(ps>.1)。

在丁级词的使用上,被试群体之间差异显著F(3,116)= 6.48,p<.001,事后多重比较(Sidak法矫正)发现,母语者和高级水平学习者之间的差异边缘显著(p = .051),汉语母语者对丁级词的使用远远超过初级水平和中级水平的学习者(ps<.01),高级水平的学习者与初级、中级水平的学习者之间差异不显著(ps>.1)。

在超纲词的使用上,被试群体之间差异显著F(3,116)= 3.21,p<.05,但事后多重比较(Sidak法矫正)发现,四组被试之间两两比较差异均不显著(ps>.1)。

那么,对于不同词类的词语,其各自复杂性的发展是否存在不同的轨迹呢?我们以动词和名词为代表,进一步考察汉语学习者和汉语母语者在叙述过程中所使用的动词和名词的复杂性,描述性统计信息如表2所示。可以看到,两类词表现出类似的模式。总体来说,不同汉语水平的学习者使用甲级词汇的比例都是最高的,而且随着水平提高没有太大变化;乙级词汇比甲级词汇少得多,在高水平学生群体中相对较高;丙和丁级词汇更少,且随水平高低没太大变化。下面我们进行统计分析进一步说明。

表2 汉语母语者与汉语学习者在叙述故事时所使用的不同等级的动词和名词的U值和标准差

对名词和动词使用的复杂性U值进行2(词类:动词、名词)×5(词汇等级:甲级、乙级、丙级、丁级、超纲)×4(被试群体:初级、中级、高级、母语者)三因素混合设计的方差分析,结果发现:

词类的主效应显著F(1,116)= 12.48,p<.005,结合表2的平均数可以计算出,名词的使用比动词略多。词汇等级的主效应显著F(4,464)= 460.50,p<.001。被试群体的主效应显著F(4,116)= 22.58,p<.001。同时,所有交互作用均显著,即词类与被试群体的交互作用显著F(3,116)= 9.50,p<.001,词汇等级与被试群体之间的交互作用显著F(12,464)= 6.73,p<.001,词类与词汇等级之间的交互作用也显著F(4,464)= 39.87,p<.001,词类、词汇等级和被试群体之间的三重交互作用显著F(12,464)= 3.56,p<.001。

由于三重交互作用显著,所以我们只需进行三重交互作用的简单效应检验,以及对应的多重比较(Sidak矫正),不再对两因素交互作用进行简单效应检验,以避免重复。我们发现:

首先,在动词使用的复杂性上,被试群体之间在甲级动词的使用上无显著差异,F(3,116)= 1.30,p>.1,也就是说不同汉语水平的学习者以及汉语母语者所使用的甲级动词比例差不多。

被试群体之间在乙级动词的使用上差异显著,F(3,116)= 13.78,p<.001。进一步多重比较(Sidak矫正)发现,汉语母语者对乙级动词的使用显著超过了三组留学生(ps<.005);在留学生内部,三个汉语水平的学习者在乙级动词的使用上两两之间的差异均不显著(ps>.1)。

被试群体之间在丙级动词的使用上差异显著,F(3,116)= 7.64,p<.001。进一步多重比较(Sidak矫正)发现,汉语母语者对丙级动词的使用显著超过了三组留学生(ps<.005);在留学生内部,三个汉语水平的学习者在丙级动词的使用上两两之间的差异均不显著(ps>.1)。

被试群体之间在丁级动词的复杂性上差异边缘显著,F(3,116)= 2.38,p =.073。

被试群体之间在超纲动词的复杂性上差异显著,F(3,116)= 7.32,p<.001。进一步多重比较(Sidak矫正)发现,汉语母语者对超纲级动词的使用显著超过了三组留学生(ps<.005);在留学生内部,三个汉语水平的学习者在超纲级动词的使用上两两之间的差异均不显著(ps>.1)。

其次,名词使用的复杂性上,被试群体之间在甲级名词的使用上无显著差异,F(3,116)= 1.92,p>.1。

被试群体之间在乙级名词的使用上差异显著,F(3,116)= 20.06,p<.001。进一步多重比较(Sidak矫正)发现,汉语母语者对乙级名词的使用显著超过了三组留学生(ps<.005);在留学生内部,高级汉语水平的学习者使用的乙级名词远远超过初、中级汉语水平学习者(ps<.005),初级和中级汉语水平的学习者之间无显著差异(p>.1)。

被试群体之间在丙级名词的复杂性上差异显著,F(3,116)= 7.25,p<.001。进一步多重比较(Sidak矫正)发现,汉语母语者对丙级名词的使用显著超过了三组留学生(ps<.005);在留学生内部,三个汉语水平的学习者在丙级名词的使用上两两之间的差异均不显著(ps>.1)。

被试群体之间在丁级名词的复杂性上差异边缘显著,F(3,116)= 2.21,p =.091。进一步多重比较(Sidak矫正)发现,除了汉语母语者和初级汉语水平的学习者之间差异边缘显著(.05<p<.1)外,其余各组之间的差异均不显著(ps>.1)。

被试群体之间在超纲名词的复杂性上差异不显著,F(3,116)= 0.55,p>.1。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈