首页 理论教育 西部少数民族语言文字电子载体的信息化建设

西部少数民族语言文字电子载体的信息化建设

时间:2022-03-04 理论教育 版权反馈
【摘要】:改革开放以来,我国西部少数民族语言文字信息处理技术取得了巨大成就,先后有多种少数民族语言文字实现了信息化处理,对少数民族地区经济发展、社会进步和文化传承起到了积极作用。蒙古语言文字的信息处理工作在少数民族语言文字信息处理领域中起步较早。此外,一些西部少数民族古文字,如西夏文、贵州古彝文的编码标准也在研究和制定中。

四、西部少数民族语言文字电子载体的信息化建设

改革开放以来,我国西部少数民族语言文字信息处理技术取得了巨大成就,先后有多种少数民族语言文字实现了信息化处理,对少数民族地区经济发展、社会进步文化传承起到了积极作用。

(一)西部少数民族语言文字信息处理标准化建设

我国自20世纪80年代就开始致力于民族文字编码标准的研制,迄今已有多种传统通用民族文字编码字符集、字形、键盘国际标准、国家标准和地方标准。

1.蒙古语言文字的信息处理标准建设。蒙古语言文字的信息处理工作在少数民族语言文字信息处理领域中起步较早。1987年,原国家技术监督局发布了内蒙古民语委、内蒙古计算中心等单位联合制定的我国第一个民族文字编码标准——《信息处理交换用蒙古七位和八位编码图形字符集》(GB8045-87),此后又先后制定了《信息处理交换用蒙古文字符集键盘字母区的布局》、《信息交换用蒙古文16×12、16×8、16×4点阵字模集》、《信息交换用蒙古文16×12、16×8、16×4点阵数据集》、《信息处理用蒙古文24点阵字模集及数据集》。1994年我国开始制定ISO/IEO10646多文种平面上的蒙古文国际编码标准。经过专家多次论证,提出了一套蒙古文字母为基础的《蒙文编码方案》,包括蒙古文、托忒蒙古文、满文、锡伯文统一的编码方案。这套方案2000年得到了国际标准化组织的通过和Unix技术委员会的认可。此外《蒙古文拉丁文转写方案》国际标准也正在研制之中。2006年6月,全国信息技术标准化委员会成立了蒙古文信息技术国家标准工作组,这标志着我国蒙古文信息技术国家标准的制定有了自己的平台。

2.藏语言文字的信息处理标准建设。藏文信息技术标准化工作开始于1993年。在国家有关部门的组织协调下,经过藏文专家和计算机专家、信息标准专家们的共同努力,完成了制定藏文编码国际标准最终方案的任务,经过国际标准化组织的多道严格的程序和数轮投票,于1997年7月在第33届WG2会议及SC2会议上正式获得通过,使藏文成为我国少数民族文字中第一个具有国际标准的文字。与此同时,国家公布了《信息技术信息交换用藏文编码字符集基本集》和《信息技术藏文编码字符集(基本集)点阵字形第一部分:白体》两项国家标准。1997年10月后又着手进行《藏文编码字符集辅助集》的研制工作。2005年8月,由西藏自治区藏语文工作委员会和西藏大学联合国内有关单位共同研制的藏文国家标准《信息技术信息交换用藏文编码字符集扩充集A》、《信息技术信息交换用藏文编码字符扩充集B》通过专家鉴定。与此同时,还通过了《信息技术藏文编码字符集键盘字母数字区的布局》标准,初步解决了藏文键盘布局不统一的问题。

3.维吾尔、哈萨克、柯尔克孜文字的信息处理标准建设。维吾尔、哈萨克、柯尔克孜三种文字都是以阿拉伯文为基础的拼音文字,大部分字母是共通的,在计算机处理这些文字时大都统一做在一个系统上,使系统具有同时处理这三种文字的功能。1989年,原国家技术监督局发布了新疆大学和新疆语委牵头制定的国家标准《信息处理——信息交换用维吾尔文编码图形字符集》(GB1250-1989)。2005年4月,新疆质量技术监督局、自治区信息化办公室发布了《信息交换用维吾尔、哈萨克、柯尔克孜文编码字符集、基本集与扩展集》、《信息交换用维吾尔、哈萨克、柯尔克孜文字体字形》、《信息交换用维吾尔文界面信息常用术语》三项地方标准。这三项标准的发布,对解决维吾尔、哈萨克、柯尔克孜文计算机编码不全、字体字形标准不一致、不统一,界面术语翻译不准确、不规范,软件之间互不兼容、互不支持等问题起到了很大作用。

4.彝族语言文字的信息处理标准建设。1988~1989年四川省民委、民语委组织西南民族学院等单位研制了《信息交换用彝文编码字符集》、《信息交换用彝文15×16点阵字模集及数据集》两个国家标准,1995年又研制了《信息交换用彝文24×24点阵字模集及数据集》标准,国家技术监督局先后批准颁布实施了这三个标准。1999年12月,国际标准化组织批准了将彝文及其部首编码到ISO/ IEC10646BMP的提案,并将之收入该国际标准2000年版。

5.傣文信息处理标准建设。傣文信息化起步虽比较晚,但它一开始走的就是国际编码标准的道路。2001年德宏傣文编码国际标准获得通过,共收入35个字符,编码空间为U1950-197F;2004年,西双版纳新傣文编码国际标准获得通过,共收入80个字符,编码空间为U1980-19DF,西双版纳老傣文的国际编码标准目前也正在制定中。

6.其他民族语文信息处理标准建设。2005年,教育部、国家语委向云南省语委下达了《纳西东巴象形文字编码字符集国际标准》的研发任务。之后,由云南省民语委和丽江东巴文化研究院联合开展的《纳西东巴象形文字编码字符集国际标准》研发工作已正式启动,目前已经完成字符的收集整理工作,纳西东巴文的国际标准有望在不久的将来问世。

2007年9月17日至21日,信息技术国际标准化组织在浙江杭州召开第五十二次会议,对各国提交的各种文字编码字符集的国际标准方案进行了讨论。云南省少数民族语文指导工作委员会与世界少数民族语文研究院共同研制并申报的西双版纳经书傣文、老傈僳文、简易苗文等字符编码国际标准经过讨论、修改和完善,统一了名称,补充了字符,调整了码位,已具备通过的基本条件。此外,一些西部少数民族古文字,如西夏文、贵州古彝文的编码标准也在研究和制定中。

(二)西部少数民族语言文字操作平台的研制和发展

截至2007年,全世界在Windows操作系统下已经有上百种文种实现了标准化,其中,中国的文字已有汉、蒙古、藏、朝鲜、维吾尔、哈萨克、柯尔克孜等文种。

1.蒙古语言文字的信息处理平台和系统建设。20世纪80年代,我国就在计算机上完成了蒙古文信息处理系统的设计。1983年,内蒙古大学和内蒙古计算中心建立了《蒙古秘史》拉丁转写计算机检索系统。1989年,内蒙古大学蒙古语文研究所和北京大学计算所、北京大学信息技术公司联合研制了在DOS环境下运行的北大华光蒙古文排版系统(后改为北大方正排版6.0多文种系统)。该系统不仅能够处理蒙古文,同时还能处理托忒蒙古文、满文、八思巴文、阿里嘎里文、卡尔梅克文、布里亚特文、新蒙古文以及汉、英、俄、日文和国际音标。另外还可以还根据需要设置一些专门系统,如蒙古文辞典编纂系统、蒙古作家用语风格分析系统、蒙古文图书管理系统、蒙医诊查系统、电视节目安排系统等。2001年北大方正集团与内蒙古大学蒙古学学院合作,开发了在Windows环境下运行的基于蒙古文书版9.1排版软件。该版软件同时具备兼容原蒙古文书版生成的小样文件和稳定性高的特点,可以支持蒙古文、托忒文、汉文、俄文、英文和日文的排版。2004年,由内蒙古大学蒙古学学院教授那顺乌日图等人研制开发的“达尔罕汉蒙电子词典”问世,“汉蒙机器翻译系统”工程取得重大进展。

2.藏语言文字的信息处理平台和系统建设。藏文软件系统研制开始于20世纪80年代初。1984年,甘肃省计算中心以及航天部710所各自开发了一套藏文字处理系统。1986年,青海省药品检验所、青海师范大学、青海民族学院与北京有线电厂合作,在CCDOS2.13下开发了与汉、英文兼容的藏文操作系统TCDOS。1988年,中国藏学中心和航天部710所推出了藏文字处理激光编辑排版印刷系统,该系统后来与潍坊华光合作开发了书林藏文排版和激光照排系统。1990年,中国计算机软件与技术服务公司等单位联合推出了北大方正藏文书报排版系统。2001年,西藏大学开发了藏文软件——“火狐”藏文处理系统;2003年,清华大学与西北民族大学合作开发了藏文多字体印刷藏文(混排汉文、英文)文档识别实验系统。2005年中科院软件所与西藏大学、西北民族大学联合开发了基于LINUX的跨平台藏文信息处理系统和办公套件。

3.新疆少数民族文字软件处理系统建设。较早的新疆少数民族文字软件处理系统主要使用的软件有基于DOS或WIN32环境的北大方正排版系统(1991),博格达维吾尔、哈萨克、柯尔克孜文排版系统(新疆民语委研制,1991),潍坊华光排版系统(1992),三立书版排版系统(1994),锡伯文、满文文字处理和轻印刷系统(新疆民语委研制,1996),“新疆2000”多文种图文排版系统(新疆民语委研制,2000),阿拉伯及多文种排版系统(新疆民语委研制,2000)等。新疆多文种操作系统主要有WINDOWS3X维哈柯文系统(1996)、多文种WINDOWS95平台“民文视窗”、WINDOWS9X维哈柯文系统(1998)、WINDOWS2000维哈柯文系统(2000)等。

2002年,潍坊北大青鸟华光科技股份有限公司开发出基于WINDOWS 2000/XP操作系统的“书林”维吾尔、哈萨克、柯尔克孜、蒙古文公文版、书刊版和报版软件,适合于办公、印刷、出版单位和个人使用。2004年8月10日,由清华大学和新疆大学联合推出的维哈柯(汉英)阿(英)双向印刷文档识别系统问世。该系统解决了维、哈、柯、阿文的文档经图像识别输入计算机的难题,并在全球首次实现维吾尔、哈萨克、柯尔克孜文与汉、英文混排以及阿拉伯文与英文混排的文档识别,这标志中国阿拉伯文字系统文档识别技术已位居国际前列。2007年,中国科学院新疆理化技术研究所、新疆西北星信息技术有限责任公司、江苏无锡永中科技有限公司联合研发成功的“跨平台维、哈、柯文办公套件”通过专家验收,并投入使用。

4.彝文信息处理系统建设。彝文操作系统的开发也始于20世纪80年代,目前已经进行的彝文计算机信息处理,都是针对国务院宣布为国家规范彝文的凉山喜德语音彝文而言的。1982年至今,我国研究开发了《PGYW彝文计算机》、《微型计算机彝文处理系统YWCL》、《计算机激光彝文/汉字编辑排版系统》、《计算机彝文/汉字/西文系统》、《CMPT—大键盘彝文系统》、《华光彝文、汉字、西文计算机激光照排系统》、《北大方正彝文激光照排系统》、《YWPS彝文桌面办公系统》、《YWDS彝文系统》等系列信息处理系统,实现了在网上浏览藏、彝文信息。

5.壮文信息处理系统建设。广西计算中心开发了古壮文计算机处理系统,并于1993年用该系统出版了《壮族民歌古籍集成》第一卷《嘹歌》,全书150万字,使壮民族古籍的整理出版进入了计算机处理的新时代。

6.傣文信息处理系统建设。傣文操作系统的研发起步比较晚。2003年,西双版纳报社和北大青鸟华光照排有限公司开发了“西双版纳新老傣文计算机排版系统”。该系统首先运用于傣文古籍整理,现已出版了傣文贝叶经十三卷。但这个系统仅限于计算机排版,还不能应用在新闻采编、电子政务、远程教育、广播电视稿等方面。

7.其他民族语文信息处理系统建设。2002年5月,被国内外学术界称为世界上“唯一活着的象形文字”的纳西象形文字首次实现计算机化,古老的纳西象形文字从此可以直接输入计算机。2006年,大连民族学院开发了纳西象形文字信息处理平台,基本完成了纳西象形文字计算机化处理平台的搭建,实现了中、英、纳西象形文的混合编排。

2007年4月,贵州三都水族自治县中国水族文化研究所研发的“中国水族文字输入系统”获国家版权局著作权登记证书,得到版权保护。该输入系统对于抢救水书工作具有极大的促进作用。

(三)西部少数民族语言文字网站、网页建设

从2000年1月6日中国互联网上第一个少数民族文字网站“同元藏文网站”正式开通,到目前为止,中国已经有了蒙古文、藏文、哈萨克文、维吾尔文和朝鲜文的网站,少数民族用户在网上下载部分系统软件和应用软件即可浏览这些网站。蒙古文、藏文、维吾尔文等少数民族文字还支持网上聊天。

1.新疆少数民族文字网站建设。2001年4月,全国第一个全面采用少数民族语言文字的政府网站,维吾尔文版、哈萨克文版的《新疆环境保护》网站成立。

2004年10月,《中国民族》杂志维吾尔文版首次出现在国际互联网,填补了网上没有维文版杂志的空白。

2009年7月,天山网哈萨克文版正式开通,这是继天山网开通汉文版、维吾尔文版、英文版、俄文版之后,又增加一个语种——哈萨克文版,成为新疆拥有语种版面最多的新闻网站。

截至2009年第一季度,新疆共有互联网站15984家,官方在新疆建立的少数民族文字网站不超过10家,较为稳定的少数民族文字网站约500家,其中维吾尔文网站400余家、哈萨克文网站30余家。

2.蒙古文网站建设。2002年7月,我国首家蒙汉双语网站——呼和浩特市政府网(蒙汉双语)正式开通。该网站在全国首家采用蒙古族语言文字发布信息,解决了蒙古族语言文字不能在互联网上浏览的关键性技术难题。

2006年12月,由内蒙古蒙科立软件有限责任公司建立的蒙驿网站开通,这是国内首家蒙、汉双语并用的综合性门户网站。蒙驿网站突破了蒙古文图文混排的传统格式,第一次实现了蒙古文由左向右的竖排字序。同时使用了蒙科立搜索引擎技术,填补了蒙古文没有搜索引擎的空白。网站还免费提供《蒙古文音码输入法》,解决了以往网民不能在网络上互相发送蒙古文稿件的难题。

2008年9月,中国蒙古语新闻信息服务网正式开通。该网站可向中国境内所有蒙古文新闻媒体提供互联网新闻信息服务和互联网新闻传播技术支撑服务。目前网站设1个主频道、10个子频道,除了蒙古文新闻信息收集、发布之外,还对上百家少数民族文字网站提供远程技术服务。该网站受众覆盖面已达31个省、市、自治区和18个国家及地区,成为我国重要的蒙古文网络平台。

3.藏文网站建设。2001年9月,西藏网藏文版正式开通。该网站设有11个栏目,为国内外关心西藏、喜爱藏文以及从事藏学研究的人士提供了一个便利实用的媒介。

2006年6月,我国首家大型藏文新闻综合门户网站——中国藏族网在青海日报社正式开通运行。

2008年12月,我国首个由省级政府主办的藏文政务网站——青海省政府藏文政务网站正式开通运行。

(四)作为第五媒介的少数民族文字手机的研制与开发

2004年1月,北京首信股份有限公司和中国移动新疆移动通信公司联合研发的全球首款“C8088”维吾尔文彩屏手机投放市场。这种手机在原有汉语、英语语言种类基础上,增加了维吾尔语言操作功能,并可实现3种语言自由转换。该手机不仅可以使用维吾尔语语音短信服务,还具备维吾尔文字菜单和输入维吾尔文字短信功能,并有和弦铃声和高速上网等功能,使新疆900多万使用维吾尔语言文字的少数民族群众通信更为方便。

2006年11月,国内首部多民族文字手机在北京中文信息处理重大成果汇报展上首次亮相。该手机涵盖了十种少数民族文字的型号,包括了蒙古语、藏语、维吾尔语、苗语、彝语、壮语、朝鲜语、侗语、哈萨克语、傣语。

2007年10月,我国首部蒙古文手机在呼和浩特面市。这款手机在原有汉语、英语语种的基础上,增加了蒙古语操作功能,可实现三种语言的自由切换,同时具备蒙古文手机菜单和收发蒙古文短信的功能。

2009年5月,由西南民族大学与北京网道信通科技发展有限公司共同研制的彝文手机正式推出。此类手机具有全彝文界面,可编辑、收发彝文短信、彩信,彝文拼音及手写输入,还具有彝族风格图片、铃音和彝文电子书等特色功能。

2009年6月,《人民日报》推出了藏文、维吾尔文手机报,9月又推出蒙古文、哈萨克文手机报。人民日报是目前国内唯一一家拥有藏文、维吾尔文、蒙古文、哈萨克文四种少数民族文字手机报的媒体。

少数民族文字手机的成功研制与普及,极大地方便了少数民族群众的信息沟通和交流,为西部少数民族地区信息化绩效的充分发挥奠定了重要的技术与社会基础。

【注释】

[1]“西新工程”是西部三区四省的广播覆盖工程,重点解决西藏和新疆的广播覆盖问题。工程涵盖面498万平方公里,占全国国土面积的51.9%,是新中国成立以来建设规模最大、一次性投入最多的一项工程。“西新工程”的实施,从根本上改变了西部地区,尤其是西藏、新疆的广播覆盖落后局面,实现了民族广播事业发展的重大飞跃。

[2]白润生.中国少数民族新闻传播史.北京:民族出版社,2008

[3]“东风工程”是由中央和地方财政专项拨款,每年按计划出版一定数量的少数民族文字出版物,包括图书、党报、党刊、音像制品和电子出版物,全部免费发放到新疆维吾尔自治区的865个乡镇和9584个行政村的公益性惠民工程。“东风工程”包括民族语文党报、党刊、图书、音像制品、电子出版物免费赠阅、发行网点建设、党报印刷设备建设7个项目。整个工程中央和新疆维吾尔自治区5年内共投入资金4亿元。“雪域东风工程”则是国家扶持西藏新闻出版业发展的又一项重大工程。

[4]少数民族事业“十一五”规划.http://news.sohu.com/20070329

[5]白润生.中国少数民族新闻传播史.北京:民族出版社,2008

[6]中国社会科学院新闻与传播研究所.中国新闻年鉴2008.北京:中国新闻年鉴社,2008

[7]包和平等.中国少数民族文献学概论.北京:民族出版社,2004

[8]中国社会科学院新闻与传播研究所.中国新闻年鉴2008.北京:中国新闻年鉴社,2008

[9]国家民族事务委员会经济发展司,国家统计局国民经济综合统计司.中国民族统计年鉴2007.北京:民族出版社,2008

[10]中华人民共和国民族事务委员会.民族文化.语言文字[EB/OL].[2009-09-19].http://www.seac.gov.cn/gjmw/mzwhws/M0405index_1.htm.

[11]包和平等.中国少数民族文献学概论.北京:民族出版社,2004

[12]金星华等.中国少数民族文化发展报告(2008).北京:民族出版社,2009

[13]白润生.中国少数民族新闻传播史.北京:民族出版社,2008

[14]周德仓.西藏新闻传播史.北京:中央民族大学出版社,2005

[15]国家民族事务委员会经济发展司,国家统计局国民经济综合统计司.中国民族统计年鉴2007.北京:民族出版社,2008

[16]中华人民共和国民族事务委员会.民族文化.语言文字[EB/OL].[2009-09-19].http://www.seac.gov.cn/gjmw/mzwhws/M0405index_1.htm

[17]白润生,中国少数民族新闻传播史。北京:民族出版社,2008

[18]同上。

[19]周明甫,金星华.中国少数民族文化简论.北京:民族出版社,2006

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈