首页 理论教育 近年来机器翻译存在的问题

近年来机器翻译存在的问题

时间:2022-04-07 理论教育 版权反馈
【摘要】:第14章 语言研究的脑信息学视角:机器翻译笔者曾经就英汉在机器翻译方面的情况做过研究。然而,以往翻译系统中存在的对标句词的识别困难在如今的翻译系统中依然存在。上述差异反映出目前的机器翻译系统在汉语原文的合法度判断方面表现得不够敏感。上述研究显示,机器翻译在处理含有句末疑问小词的结构时表现得不够敏感。

第14章 语言研究的脑信息学视角:机器翻译

笔者(吴会芹,2003)曾经就英汉在机器翻译方面的情况做过研究。从当时的翻译系统译文质量来看,有些系统已经能够做到把常用会话、含有固定短语的句子及不含标句词的定语从句译得很好,如:

(6)原文:The friends you praised sometimes deserve it.

Matrix译文:你有时赞扬的朋友应该是它。

人工译文:你有时赞扬的朋友很值得赞扬。

虽然Matrix系统在对远距离的谓词deserve的语义还把握得不够准确,但却能较好地识别不含标句词的简单定语从句you praised sometimes。

如今,这些英语的机器翻译在有道、百度及谷歌翻译系统下质量已经有了明显的提高,如:

(7)原文:The friends you praised sometimes deserve it.

有道译文:你的朋友称赞有时应得的。

百度译文:你有时赞扬的朋友值得。

谷歌译文:赞美你的朋友,有时值得。

然而,以往翻译系统中存在的对标句词的识别困难在如今的翻译系统中依然存在。如:

(8)原文:I don't know the boy who is waiting outside.

译文:我不认识这个男孩谁在外面等着。

人工译文:在外边等着的那个男孩我不认识。

(吴会芹,2003)

如今,虽然随着语言学理论及技术的发展,许多机器翻译系统的译文的可读性已经有了很大的改进,如有道、百度、谷歌翻译系统对(8)原文翻译如下:

(9)原文:I don't know the boy who is waiting outside.

有道译文:我不知道那个男孩正在外面等候。

百度译文:我不知道那个男孩是谁在外面等着。

谷歌译文:我不知道外面等候的男孩是谁。

(9)的译文显示,这些软件在对who的语义及其功能等识别方面存在困难。

Who在句子中既可以充当疑问词功能,也可以发挥标句词的功能作用,如果与否定词连用还会表示极端用法。显然,上述翻译系统不仅对who的多重语义及功能的判断存在困难,而且对含有标句词的定语从句翻译仍然有些问题。

此外,以往机器翻译系统曾经存在过的问题有些依旧存在。如史晓东(Mandel Shi)于1990—1995期间编写完成的Matrix英汉翻译系统(罗选民等,1999)曾在一些相对复杂的成语、习语的分析方面有很大的不足。如:

(10)原文:He always asks for moon.

Matrix译文:他总是正在请求月亮。

人工译文:他总是想入非非。

(11)原文:Ross wanted to phone the man with the limp.

Matrix译文:Ross想要用跛打电话给男人。

人工译文:Ross想要打电话给拄着拐杖的男人。

如今,这些固定结构的翻译问题在谷歌、百度及有道等翻译系统中依然存在,如:

(12)原文:He always asks for moon.

谷歌译文:他总是问月亮。

百度译文:他总是要求月亮。

有道译文:他总是问月亮。

(13)原文:Ross wanted to phone the man with the limp.

有道译文:罗斯想打电话给那个拿着一瘸一拐。

百度译文:罗斯想打个电话与跛行。

谷歌译文:罗斯想打电话与跛行的人。

生成语法理论框架下的英语标句词理论研究已经取得了长足的进步,其理论框架已经非常成熟。通常情况下,这些标句词被视为一个句子的标志置于句子或子句的句首。即使在一个完整的句式中没有显性标句词,但却默认它隐性存在,因此它是标示一个句子的功能成分。如能在该理论框架下将具有相应前置词的标句词(如wh-词)结构规定为标句词结构CP,将无前置词的标句词(如wh-词)结构规定为疑问句,再根据这个CP的结构有无倒置结构需求,从而将非倒置结构中的wh-词规定为标句词,将倒置结构中的wh-词规定为疑问词,这样或许能够在一定程度上解决英语wh-词在机器翻译中的汉译问题。

笔者近期对英汉存在句的机器翻译进行了研究,结果显示,目前的机器翻译系统都能较好地处理结构较为简单的存现句,如:

(14)原文:房间里有个人。

译文:There is a man in the room.

(15)原文:房间里有三个学生。

译文:There are three students in the room.

然而,如果将存在句变得稍微复杂,这些翻译系统就会显得力不从心。以下是谷歌翻译系统下的几例译文:

(16)原文:桌子上有一本令人喜欢的书。

译文:There is on the table like a book.

(17)原文:在桌子上有一本令人喜欢的书。

译文:On the table there is a likeable book.

(18)原文:有一本令人喜欢的书桌子上。

译文:There is a very favorite book on the table.

(19)原文:有一本令人喜欢的书在桌子上。

译文:There is a very favorite book on the table.

研究显示,虽然(16)原文与(18)原文相比其接受度较高,但其英译结果并不对称。相反,虽然(18)原文不合语法而(19)合法,但二者的英译效果完全相同。上述差异反映出目前的机器翻译系统在汉语原文的合法度判断方面表现得不够敏感。

此外,目前机器翻译系统对简单的汉语疑问句翻译较好,如:

(20)原文:你认识他吗?

译文:Did you know him?

但如果对(20)进行稍加处理,其机器翻译系统就会出现问题,如:

(21)原文:他们了解这些人吗?

有道译文:They know these men?

百度译文:They know these people?

谷歌译文:They know these people?

正确译文:Do they know these people?

上述研究显示,机器翻译在处理含有句末疑问小词的结构时表现得不够敏感。如能在生成语法理论框架下将含有的句末疑问小词"吗"、"呢"等视为与英语"do"对应的功能疑问词,就会提高汉英疑问句的机器翻译质量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈