首页 理论教育 世界语言普查概览

世界语言普查概览

时间:2022-04-01 理论教育 版权反馈
【摘要】:世界语言普查概览张璟玮提 要:“语言普查”一般是指人口普查中的语言调查,是一种人口统计学意义上的调查。因此,语言普查是研究各国语言国情的重要途径,也是我国开展语言国情调查时应该考虑的内容。此外,各国语言普查操作层面上的经验和教训对我国的语言调查也有借鉴意义。本文将在这些研究的基础上,进一步收集世界各国语言普查的材料,综述各国语言普查的基本情况。

世界语言普查概览(1)

张璟玮

提 要:“语言普查”(language census)一般是指人口普查中的语言调查,是一种人口统计学意义上的调查。本文以联合国人口统计年鉴为索引,对2000年普查周期中55个国家和地区的语言普查内容和形式进行分类概括。研究发现语言普查的结果在确定语言分布、语言使用状况、语言变化以及语言与其他社会因素的联系方面具有无可替代的作用。因此,语言普查是研究各国语言国情的重要途径,也是我国开展语言国情调查时应该考虑的内容。此外,各国语言普查操作层面上的经验和教训对我国的语言调查也有借鉴意义。

关键词:语言普查 语言国情 人口普查 联合国

“语言国情”是国情的重要组成部分,是指一个国家语言方面的基本情况和特点,与一个国家政治制度、经济制度、科学技术、人口素质、自然资源、生态环境等方面的国情共同构成国情的总和。江蓝生(2006)、姚亚平(2006)57-61、陈章太(2007)、戴庆厦(2008)等都对语言国情调查的重要性有过论述。对语言国情状况的掌握关系着国家语言政策的制定和国家语言规划的进程,是国家级语言规划的重要组成部分;语言国情调查是分析当前国家语言文字使用状况的手段,是进一步确立语言规划目标、制定语言规划实施方案的基础。

获取语言国情数据的调查有两类:“语言调查”和“涉及语言问题的大规模调查”。“语言调查”是为了获取国家语言生活状况信息而专门设计的调查,所获数据是语言国情的“初级数据”;与此相对,“涉及语言问题的大规模调查”所获数据是“二级数据”,来源于全国性或超国家范围调查中包含的语言问题。由于语言具有社会文化、民族身份等指示含义,很多社会调查、人口调查中都包含语言问题,如亚洲指标调查(Asian Barometer)、非洲指标调查(Afrobarometer)、世界价值观调查(World Values Survey)[1]

各国通过人口普查所获得的关于语言国情的数据是典型的“二级数据”,国外一般称这类调查为“语言普查”(language census)(Verdoodt,2001;Arel,2002;De Vries,2005)。本文即以语言普查为研究对象,研究其历史发展和研究途径,综述各国语言普查的内容和形式等基本信息,为我国语言普查的开展做准备。

Shryock&Siegel(1976)275-278综述了1955 1964年各国人口普查中的语言问题。除此之外,学界还没有开展过对所有国家语言普查综述性的研究(De Vries,2005)。国内苏金智《国内外语言文字使用情况调查概述》(1999)一文提及了在人口普查中调查语言问题的优缺点,这是国内迄今为止唯一可以见到的有关“语言普查”的论述文章。本文将在这些研究的基础上,进一步收集世界各国语言普查的材料,综述各国语言普查的基本情况。

一 语言普查的历史发展

联合国对人口普查的定义是“收集、汇编、评价、分析和公布或以其他方式传播关于某一特定时间一国或一国内某一严格划定地区所有人的人口、经济及社会资料的整个过程”。(国际经济与社会事务部统计司,1998)3一般认为现代意义上的人口普查是从美国1790年人口普查开始的。美国是世界上最早定期进行人口普查、公布普查结果并把开展人口普查写进宪法的国家,迄今已有200余年历史。

语言普查并非与人口普查同时产生,1846年比利时在人口普查中最先设立了语言项。19世纪50年代,普鲁士和瑞士也在人口普查中调查了本国的语言情况。1853年,国际统计学大会(the International Statistics Congress)第一次会议在布鲁塞尔召开,会议决定把“使用的语言”(spoken language)列为标准化人口普查项目之一。1857年,大会在维也纳召开,普查中语言的问题被间接提及。当时统计学家最关心的概念是那个时代在欧洲广有影响力的“国籍”(nationality),这一概念在1789年法国大革命后加入了“公民身份”(civic)这一要素。维也纳会议中讨论了人口普查中“国籍”概念是否能够通过某种形式编码。经过讨论和修改,1872年在圣彼得堡的会议上确定“语言”是在普查中调查个人“国籍”最可信且可行的指标。(Arel,2002)

从19世纪80年代起,东欧的一些国家也开始在人口普查中调查语言,这些国家把语言项作为判断国籍的有效指标。第一次世界大战后,奥匈帝国、德国和俄国成为独立的国家或是苏联的一部分,这些国家的人口在人口普查中开始直接用询问“国籍”代替原来的语言项,或者在问语言项的同时增加“国籍”选项。(Arel,2002)

从语言普查产生和发展的历史来看,语言普查并不是应语言学学科的要求而产生的。人口普查中语言指标对于国家最主要的用途来自其所对应的社会文化含义。国家可以通过语言来界定国民的身份,进一步强化公民的国家认同,同时也辅助其他外交、军事行为进行疆界的确定。人口普查所得的语言数据从本质上来说并不适用于语言学的分析,但是它们在确定语言的使用状况、分布、发展趋势以及与社会其他方面的联系方面有无可替代的优势(Lieberson,1969)286,很多国家将其作为语言政策制定和实施的基本要素(De Vries,2005)。社会语言学兴起之后,一些研究者开始关注语言普查的信度和效度(Lieberson,1966)(Dittmar,1976)173(Beardsmore,1982)70-72,二语习得领域也出现了使用语言普查数据确定语言习得关键期的研究(Stevens,2004;Wiley et al,2004),语言普查与语言学研究的结合正在逐步发展。

二 联合国的工作

自1948年起,联合国国际经济与事务部统计司(Statistical Office of the United Nations,Department of Economic and Social Affairs)每年都会就一个主题发行人口统计年鉴(Demography Yearbook,以下简称DYB或“年鉴”),到2006年为止共已出版58本及4本特刊(分别于1977、1991、1997、1999年推出)。年鉴的主题涉及普通人口统计学、出生率统计、死亡率统计、人口普查统计等方面。以“人口普查统计”(Population Census Statistics)为主题的年鉴中包含了各国语言普查数据的汇总。1956、1963、1964、1971、1973、1979、1983、1988、1993、2006年的人口统计年鉴即以此为主题,包含了语言普查的统计数据。这些年鉴中所收集的世界各国语言普查的数据是迄今为止各类文献中能够见到的最多、最完整的数据。本文将以这些统计年鉴所收集的数据为基础,列出各大洲及地区开展语言普查的国家和地区数,详见表1。

表1 1945 2003年各大洲及地区开展语言普查的国家和地区统计[2]

img92

从表1可以看出,每一阶段全球都有30个以上的国家在人口普查中关注语言问题。不同洲开展语言普查的国家和地区的比例不同。根据1970周期(1965 1974年)和1980周期(1975 1984年)中开展普查的国家和地区总数来看,亚洲和欧洲开展语言普查的比例稍高,能达到40%左右,而其他洲均在30%以下。根据联合国的数据,1945 1954年间,有52个国家和地区在人口普查中调查了语言问题,而1955 1964年陡降至36个,推究原因可能是1945至1954年间的统计数据包含了十余个英属、法属或荷属殖民地,殖民地的人口普查政策很大程度上受宗主国的影响。

在人口普查中比较稳定地保留语言项的国家和地区有[3]:非洲的毛里求斯、南非和赞比亚;北美洲的伯利兹、加拿大、墨西哥、波多黎各和美国;南美洲的玻利维亚和巴拉圭;亚洲的中国香港、以色列、巴基斯坦和菲律宾;欧洲的奥地利、匈牙利、列支敦士登、罗马尼亚、瑞士和英国以及大洋洲的澳大利亚。

就年鉴所提供的数据来看,1945 2003年全世界有137个国家和地区开展了语言普查。联合国的工作是汇总各国提供的资料,因此年鉴中收集的数据并非穷尽。有些国家有进行语言普查的传统,如伯利兹、加拿大、墨西哥、新加坡和南非等,但是年鉴中并没有完全列出这些国家所有进行语言普查的年份,因此某些时间段内开展语言普查的国家数目要超过年鉴所收集的数目。尽管如此,年鉴中的数据还是能够反映语言普查在世界上分布的概貌,有助于我们从中概括出具有普遍意义的经验。

三 语言普查中的三类数据

联合国国际经济与事务部统计司综观各国语言普查的内容后提出,在语言普查中可收集三类数据:(1)母语(个人幼年时在家中常说的语言);(2)常用语(个人目前在其现居家中所说或经常说的语言);(3)说一种或一种以上指定语言的能力;并对1970普查周期和1980普查周期间主要地理区域的语言数据进行了分类统计。(Statistical Office,Department of Economic and Social Affairs,1992)58-61具体见表2:

表2 1970普查周期和1980普查周期主要地理区域的语言类型数据[4]

img93

1970普查周期中,大多数国家设置的问题都涉及母语或常用语,而1980普查周期间发生了转变,开始问常用语或指定语方面的问题,而且同时问两类问题的国家和地区的数量也开始增多。由于每个国家的语言国情都不一样,并不能对此转变作统一的解释。每个国家在普查时都会考虑成本效益因素,调查重点的转变至少说明每类语言数据所对应的社会文化含义不相同。

母语,通常比其他类型的语言数据更能反映人口的族群血统。“母语”与“民族性”的天然联系让很多民族成分比较复杂的国家都会通过对母语的调查来显示国家的族群构成。尽管有些族群成员的生活习俗和文化信仰已被多数族群的成员同化,但是还是能够通过调查母语这一指标来推断他们原来的族群身份。但是母语这一指标并不能反映调查时人口的实际语言能力,而且变化速度和变化范围都相对较小。

常用语不像母语那样能够准确地反映族群构成,但是常用语如果与国籍、出生地、民族等数据联系起来就能反映不同群体语言同化的情况。这类数据对于分析社会语言使用的同质和差异的程度,对于标准语的推广和国家语言政策实施的评估有较为重大的意义。联合国将常用语定义为个人目前在其现居家中所说或经常说的语言,但在实际调查中一些国家会调查国民在不同场合常用语的使用状况。

“指定语的能力”是指调查指定的一种或几种语言的掌握情况,包括掌握程度。基本上所有涉及“指定语言”的问题都是针对该国的官方语言或重要语言的。调查指定语可以用于确定以非指定语为母语的群体,如少数民族群体、移民群体对指定语的掌握情况,国家可以据此在行政、教育和公共服务领域制订相应的语言教育政策和语言服务政策。

以上三种语言国情数据的收集各有不同的语言规划含义。有条件开展语言普查的国家可以根据本国国情的需要决定选择一种或几种,而不必受其他国家调查方案的影响和限制。

四 2000年人口普查周期中的语言普查

(一)研究材料

联合国2006年发布的普查特别主题(Demographic Yearbook Special Census Topics)中收录了1985年到2003年按语言、性别和城乡三个变量统计的各国人口状况表(Table 5 Population by language,sex,urban/rural residence:each census,1985 2003,以下简称“普查语言表”)[5],表中列出的国家是本节讨论的范围。为了进一步研究这些国家2000年普查周期(1995 2005)中语言普查的具体内容,笔者查阅了“普查语言表”中每个国家的人口普查问卷,从中摘录并翻译了55个国家和地区的语言普查问题。[6]

这些调查中所包含的语言项对我们来说最具借鉴意义的是问题的内容,即调查什么以及问题的表达方式,同时问题的形式、提问的对象等一些细节也具有参考价值。下面就对这些方面作一些分析,其中调查问题的内容是分析的重点。

(二)调查内容

Agheyisi&Fishman(1970)将社会语言行为分为语言行为(Language Behavior)和针对语言的行为(Behavior toward Language)两类。Cooper(1980)在Agheyisi&Fishman(1970)分类的基础上又进一步将“语言行为”分为三个评估角度:能力(Proficiency)、习得(Acquisition)和使用(Usage)。其中“能力”是指掌握语言变体的数量和程度;“习得”是指学习的顺序;“使用”是指语言的使用场合等。Cooper(1980)还将“针对语言的行为”分为“态度方面的(Attitudinal)”和“实现方面的(Implementational)”。“态度方面的行为”可以理解为通常所说的语言态度,是指个人对于某种语言变体所持的意见和感觉等,他认为是一种不可观察的指标,通常要靠可观察的“实现方面的”语言选择、对孩子的语言教育等来衡量。本节将参照Cooper的分类来分析2000年普查周期语言普查的内容。

1.能力(Proficiency)

大多数国家或地区[7]的语言项都涉及了语言能力。有关“能力”的问题一般可以分为两类:掌握的语言变体和对语言变体的掌握程度。

对“掌握的语言变体”的调查通常关注官方语言或重要的语言变体,将这些语言名称编入问题、选项或者注释中,以提高问题的针对性。但是这在某种程度上又使问题的提法带有了倾向性,违背调查中立客观的原则。大多数国家或地区调查的都是语言,也有个别国家或地区在调查中涉及了方言和克里奥尔语,如:毛里求斯(2000)问卷注释中指出“出于普查的目的,请考虑将克里奥尔语、博杰普尔语等算作语言”,中国香港、澳门以及匈牙利、瑞士、阿鲁巴岛、伯利兹城的调查也都将方言或克里奥尔语列入选项。

“掌握的语言变体”中比较特殊的一类问题是对于“读写能力(literacy)”的调查,既调查是否会说这种语言,也调查对这种语言所对应文字的阅读和书写能力。“读写能力”是国民文化素质指标之一,国家可以根据这一指标直接或间接得出文盲率。2000年普查周期人口普查中调查“读写能力”的有12个国家,分别是:阿尔及利亚、布基纳法索、加纳、马拉维、毛里塔尼亚、毛里求斯、纳米比亚、塞内加尔、玻利维亚、菲律宾、汤加和瓦努阿图,其中非洲国家占了8个。

调查“语言变体掌握的程度”最简单的是二分设置,即“会/能”还是“不会/不能”,如:马拉维、纳米比亚、尼泊尔、爱沙尼亚、爱尔兰、汤加(1996)等国家或地区的调查采用了这种提法。比较复杂一些的是加一些表示程度的状语,如“流利”、“熟练”等,如:布基纳法索(流利)、中国澳门(流利)和哈萨克斯坦(熟练)的调查。“流利”、“熟练”较“会/能”的定义要具体一些,但还属于比较抽象的概念,首先不同的调查设计者对于这两个概念的定义和标准不同,其次每个被调查人对于“流利”或“熟练”的理解也不一,这样的表述虽然比较简洁,但也可能导致调查的信度不高。在设计语言变体掌握程度的问题时还要避免问题具有双重含义,即,在同一问题里既问是否掌握某种语言,又问对它的掌握程度,这样具有双重含义的问题所获的数据是无效的。例如,乌克兰在2001年的人口普查中的第一题是“母语: ,如果你的母语不是乌克兰语,请指出你是否流利地懂得乌克兰语:1.是,2.不是”,对于这一问题,选择“不是”的答卷人有可能是会说乌克兰语但说得不流利的,也有可能是不会乌克兰语的。或许乌克兰政府并不需要区分这两类人,但是就技术上来说只要增加一个选项就能获得更准确的信息,即把选项改为“1.是,2.会乌克兰语但说得不流利,3.不会乌克兰语”。不仅在语言变体掌握程度的问题里要避免双重含义,其他问题的表述中也需要注意这一问题。

对于掌握程度更精确一些的表述是加上一些更具体的限制,如:汤加1996年的调查是用最简单的“能(阅读和书写)”来提问,2006年的问题就改成了“能阅读和书写一句简单的话吗”;中国澳门2001年的调查用“流利地说(speak other languages/dialects fluently)”,2006年的调查则改进为“流利地交流(can speak fluently to communicate with others)”。摩尔多瓦和瑞士都将“掌握”定义到能够进行思考的级别;比较多的情况是将掌握程度限制在“交谈”级别,即问在交谈中能(很好地)使用哪些语言,如:安圭拉岛、阿鲁巴岛、加拿大和中国香港。新西兰的提法更具体,是“你能够在会话中用哪种语言谈论日常生活中的许多事情”。值得注意的是,Chiswick&Miller(1998)对美国移民的研究指出:有些移民能够在交谈中使用英语,但是他们的英语并没有达到“流利”程度,不能认为能够在交谈中使用某种语言的人数就等于能够流利使用这种语言的人数。这一研究再次提醒我们,在调查问题的设置时需要明确问题所包含的每一个概念的内涵和外延,尽可能多地考虑一些特例,并在问题设置的表述或注释中照顾到这些极端情况。

还有一种调查“语言变体掌握的程度”方法是将对某种语言的掌握程度分成几个等级供答卷人选择,如美国将对英语的掌握分为“很好(Very well)”,“好(Well)”,“不好(Not well)”和“一点也不好(Not at all)”四个级别,哈萨克斯坦将对母语的掌握分为“掌握”,“掌握程度一般”,“没有掌握”和“正在学”四个级别,伯利兹城将对西班牙语和英语的掌握程度分为“非常好”,“不是很好”,“几乎/根本不说”和“不知道/不回答”四种情况。“好”和“掌握”都是相对抽象而笼统的概念,这种等级答案的明确性也值得商榷。

2.习得(Acquisition)

调查“习得”方面最重要的问题是“母语”,也有的国家表述为“第一语言”,在我们的材料中有不到一半[8](24个)的国家或地区调查了这方面的问题。绝大多数国家的问卷中直接用“母语/第一语言”这个概念,没有做任何解释,但是也有些国家对其做了注解。这些注解可以分为两类:(1)母亲的语言:捷克的问卷在注释中说母语是“母亲或祖母所说的语言”,斯洛伐克的问卷指出“如果父母操不同语言,请写母亲的语言”;(2)幼年的语言:伯利兹城的问卷调查的是“幼时在家说的第一语言”,加拿大表述为“幼年在家学会的语言”,玻利维亚则问“幼年时说哪种语言”,前南斯拉夫马其顿的解释为“最小时学会的语言”。语言学家似乎已经达成共识,而且看上去已经非常普及的一个语言学概念“母语”都有不止一种的理解:第一语言、母亲的语言和幼年的语言,由此可见调查问题在表述时选择简单明了、通俗易懂的语言,避免专业词汇和术语是获得有效数据的前提之一。

3.使用(Usage)

语言使用包括调查语言使用的场合、频率和对象。普查中涉及语言使用最多的一类题目是“家庭语言”,即在家里说什么。调查这一项目的国家或地区有:毛里求斯、塞舌尔群岛、南非、阿鲁巴岛、伯利兹城、加拿大、荷属安的列斯群岛、波多黎各、美国、中国香港和澳门、奥地利、白俄罗斯、匈牙利、波兰、斯洛文尼亚、瑞士、澳大利亚和密克罗尼西亚联邦。其中比较严密的表述方法是将使用场合、使用对象和使用频率结合起来,如瑞士调查“在家与家人”所用的语言(使用场合+使用对象),加拿大、荷属安的列斯群岛、中国香港和澳门、奥地利等调查“在家经常说”的语言(使用场合+使用频率)。

除了调查家庭语言外,有些国家也涉及了其他场合,但是这样的国家比较少。如:瑞士2002年的人口普查就调查“学习或工作”以及“在家与家人”这两个场合下常用语的使用情况,摩尔多瓦共和国2004年人口普查中常用语的调查则分为“接受教育或工作场合中”以及“在家中或亲属间”两种场合。

调查使用频率时大多数国家用的是“经常”这样比较笼统的概念,但也有国家在普查中做了更明确的等级划分,如爱尔兰调查爱尔兰语的使用频率时,2002的题目是“如果会(说爱尔兰语),你 说爱尔兰语?”选项分别为“每天”、“每周”、“很少”和“从不”,而2006年普查时调查得更为细致,将“每天”又分为“在教育系统中”和“在教育系统外”两种情况,这种相对量化的选项有效地消除了问题的含糊性,相较于大多数国家所用的笼统概念更为合理。

4.态度方面的(Attitudinal)和实现方面的(Implementational)

人口普查中的语言项极少涉及到“针对语言的行为”,只有瓦努阿图2001年的调查中的一道题目是关于“实现”方面的,但态度是通过实现表现出来的,因此暂时将两个方面合起来。瓦努阿图2001年人口普查中的这一题是:“如果你可以选择,你愿意让你的孩子进哪种语言的学校?”,有“英语”、“法语”、“英语和法语”和“没有倾向性”四个选项。

总体来说,用通过“实现”推测语言态度的方法要比直接问哪种语言有权威、有亲和力更客观一些。

(三)调查形式

除了调查内容,人口普查语言项设置还涉及一些其他方面,如提问的方法、问题的对象(答卷人)等,这些细节处理得好坏也关系着能否获得真实、有效的调查数据。

一般社会调查中问卷调查的提问方式包括填空式、列举式、二项选择式、多项选择式(单选、多选和任选)、多项排序式及矩阵式(或表格式)(风笑天,2002)137-146。人口普查中的语言项也涵盖了这些形式中的大部分(除了多项多选式),最后两种比较少见,但也都有国家使用,密克罗尼西亚联邦和摩尔多瓦就用了多项排序式,而匈牙利在选做题里使用了矩阵式。矩阵式适用于编排选项相同且选项较多的几道问题,既可以节省问卷篇幅,也可以避免答卷人重复阅读选项。

填空式一般用于提问母语;列举式多用于提问掌握的语言,如摩尔多瓦,但更多国家或地区是将选择和列举相结合,即给出几个选项,如果没有适用的选项,答题人也可以列举,如:澳大利亚、加拿大、中国香港等的调查。填空式和列举式都是开放的问题,优点在于可以让答题人不受限制、不受引导地回答自身情况,所获信息最为真实和自然,但缺点在于:(1)需要答题人有书写能力;(2)可能会收集到一些无效或冗余信息;(3)对于后期数据处理有较高的技术要求,但相较于成段、成句的答案,仅是语言名称的列举,还是相对容易处理的。

多项选择式(单选、多选)是最常用的提问形式,由于是封闭的提问方式,其优缺点与开放式问题刚好相反,设计这类题目最重要的是要保证选项逻辑的严密性,即选项覆盖范围穷尽,属于同一层次而没有重叠,含义明确且与题目相配合。单选题比多选题在数据统计的方便性上更胜一筹。但是个人无论是在语言能力、习得、使用还是语言态度方面都会出现比较复杂的情况,尤其在有多语传统的国家中,很难说哪种语言一定就是最早学会、说得最流利、用得最多或者是最喜欢的,因此只统计这些问题的一个答案往往会使结果与真实情况有一定偏差。例如,加拿大唯一一道在人口普查长表和短表中都出现的语言题是问“幼年在家学会并且现在还能理解的第一语言是什么?”要求在“英语”或“法语”中选一个或者填写一种其他语言。De Vries(2005)指出加拿大儿童极有可能同时学习两种或多种语言,尤其是那些父母双方操不同语言的孩子,他们极可能是双母语而且两种语言都能学得很好,例如在魁北克西部和安大略东部同时以英语和法语为母语的孩子的比例就很高。但是加拿大语言普查中的这道问题由于设置为单选而不能真实地反映加拿大的双母语现象。因此选择题要慎用单选形式,如果一定要设置为单选,首先要确保题目的所限定的情况已经非常具体,降低出现多种可能性的机会,如将“在工作场合中说什么话”分为与顾客、上司、同事、下属四种情况后,每种情况说一种以上语言的可能性就大大降低,此时再设为单选题就更合理些。其次要将每个选项细化到仅能作唯一解释的情况,如将加拿大人口普查中的那道题目的选项改为“英语”、“法语”、“英语和法语”及“填写其他情况,如果幼年同时学习一种以上语言,请列出所有的语言名称”。

各国对于参加语言普查人员的要求差异较大,大多数国家调查所有参加普查的人口,还有一部分国家认为幼童语言能力不完善,多设置年龄界限,只在一定年龄以上的人群中进行语言普查。对于年龄界限各国也没有统一标准,从2岁到14岁不等。是否对回答语言项的答题人年龄设限,一方面可以根据各国儿童掌握语言的情况而定,另一方面也要考虑问题的内容。一般问母语的问题不设置年龄限制,也有些国家(瑞士、毛里求斯)用婴儿母亲的语言代替婴儿的母语。

五 结论

本文以语言普查为研究对象,概述了语言普查的历史发展、研究途径、调查内容和调查形式。从历史发展来看,近些年来语言普查与语言学研究的结合正逐步发展;从获得语言国情数据的角度来看,语言普查研究是语言规划研究的必不可少的一部分。联合国国际经济与实事务部统计司发行的以“人口普查统计”为主题的年鉴是研究二战后全球各国语言普查的重要索引。本文即以此为途径,概述了1945年至2003年各大洲开展语言普查的情况;总结了语言普查所调查的三类重要的语言国情数据:母语、常用语和指定语在语言规划层面上的内涵;并对2000年普查周期中55个国家和地区语言普查的内容和形式作了分类解析,总结语言普查操作层面上的经验和教训。

语言普查是语言国情调查的重要组成部分,是全面无偏差地掌握某些语言国情项目的有效手段。本文对语言普查的探索性研究希望能够起到抛砖引玉的作用,引起学界对这一问题的重视和进一步的探讨。

img94

参考文献

陈章太.2007.语言国情调查研究的重大成果.语言文字应用(1).

戴庆厦.2008.论新时期我国少数民族的语言国情调查.云南师范大学学报:哲学社会科学版(3).

风笑天.2002.社会调查中的问卷设计.3版.天津:天津人民出版社.

国际经济与社会事务部统计司.1998.人口和住房普查的原则和建议:中文版.

江蓝生.1999.语言国情调查的价值和意义.语言科学(1).

苏金智.1999.国内外语言文字使用情况调查概述.语言文字应用(4).

姚亚平.2006.中国语言规划研究.北京:商务印书馆.

Agheyisi R,Fishman J.1970.Language Attitudes:A Brief Survey of Methodological Approaches,Anthropological Linguistics,12:137 157.

Arel D.2002.Language categories in censuses:backward—or forward-looking?//Kertzer D,Arel D.Census and Identity:The Politics of Race,Ethnicity,and Language in National Censuses,Cambridge University Press:71 91.

Baetens-Beardsmore H.1982.Bilingualism:Basic Principles,Clevedon:Multilingual Matters.

Cooper R.1980.Sociolinguistics Surveys:the State of the Art.Applied Linguistics,V.1,2:113 128.

De Vries J.2005.Language Censuses//Ammon U,Dittmar N,Mattheier K,Berlin eds.Sociolinguistics:an International Handbook of the Science of Language and Society Volume 2,New York:Mouton de Gruyter:1104 1116.

Dittmar N.1976.Sociolinguistics:A Critical Survey of Theory and Application,trans.Sand P,Seuren P A M and Whiteley K.London:Arnold.

Lieberson S.1966.Language Questions in Censuses,Sociological Inquiry Spring:262 279.

Lieberson S.1969.How Can We Describe and Measure the Incidence and Distribution of Bilingualism?//Kelly L.Description and Measurement of Bilingualism,Toronto:University of Toronto Press:286 295.

Shryock H S&Siegel J S.1976.The Methods and Materials of Demography,New York:Academic Press.

Statistical Office,Department of Economic and Social Affairs.1992.Handbook of Population and Housing Censuses(PartⅡDemographic and Social Characteristics),New York:58 61.

Stevens G.2004.Using Census Data to Test the Criticalperiod Hypothesis for Second-language Acquisition.Psychological Science,15(3):215 216.

Verdoodt A.2001.The Demography of Language//Coulmas F.The Handbook of Sociolinguistics.北京:外语教学与研究出版社.

Wiley W,Bialystok E&Hakuta K.2004.New Approaches to Using Census Data to Test the Critical-Period Hypothesis for Second-Language Acquisition,Psychological Science,16(4):341 343.

作者简介

张璟玮,乌特勒支大学语言学院博士研究生,中国语言战略研究中心兼职研究员。

【注释】

(1)本文是国家语言文字应用“十一五”重点科研项目“中国语言普查论证报告——国外、社会语言学”(ZD115 09)的部分研究成果。

******

[1]关于这三个调查,详情可依次参考:http://140.109.171.198/chinese/news.html,www.afrobarometer.org/data.html,www.worldvaluessurvey.org。

[2]表中括号中的数字是这一时期开展普查的国家和地区总数,数据来源:国际经济与社会事务部统计司,1997,《人口和住房普查手册——第四部分:经济活动状况》(中文版),第1页。

[3]本文所列地名若不特别指出均按其英文首字母先后顺序排序。

[4]译自Statistical Office,Department of Economic and Social Affairs 1992 Handbook of Population and Housing Censuses(PartⅡDemographic and Social Characteristics),United Nation,New York,p.62中表13。

[5]网址:http://unstats.un.org/unsd/demographic/products/dyb/dybcens.htm

[6]对这些人口普查问卷作几点说明:(1)所有问卷都下载自联合国2010年世界人口和住房普查项目(2010 World Population and Housing Census Programme)人口普查问卷网页(网址:http://unstats.un.org/unsd/demographic/sources/census/censusquest.htm#H);(2)本文没有讨论“普查语言表”中提及但人口普查问卷未被收入上述网页的4个国家:圣多美及普林西比民主共和国、波斯尼亚和黑塞哥维那、芬兰和印度尼西亚;(3)“普查语言表”中一些国家2005年以后也开展了人口普查,其中的语言项也被摘录,作为本节讨论的材料。本节讨论材料所涉及的国家、地区及调查年份如下表所示。

[7]本节所涉材料中没有调查语言能力的国家有:塞舌尔群岛、阿塞拜疆、克罗地亚、捷克、拉脱维亚、波兰、摩尔多瓦、罗马尼亚、塞尔维亚和孟的内哥、前南斯拉夫马其顿。

[8]母语:前南斯拉夫马其顿、乌克兰、罗马尼亚、塞尔维亚和孟的内哥、斯洛伐克、斯洛文尼亚、拉脱维亚、立陶宛、白俄罗斯、克罗地亚、捷克、爱沙尼亚、匈牙利、哈萨克斯坦、吉尔吉斯斯坦、尼泊尔;第一语言:塔吉克斯坦、亚美尼亚、阿塞拜疆、埃塞俄比亚、塞内加尔、伯利兹城、加拿大、毛里求斯。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈