首页 百科知识 与时间词的搭配

与时间词的搭配

时间:2022-09-17 百科知识 版权反馈
【摘要】:被校验的主角是“当”,其它双字介词产生歧义的机会很小,但是也要考虑。检索到配套词汇后,把8号介词库的介词与7号时间词库的配套时间词,以及其中所夹的所有字符分割出一个字符串,作为分词结果。

 

介词也会与时间词汇搭配,构成配套结构。

【词库介绍】

下面是与介词搭配的时间词词库。它的标号为7。这个介词库的主要介词有7-1:时。7-2:时候。7-3:纪(包括世纪、中生纪等,以最后一字为识别标准)。7-4:代(包括古代、年代、时代等,以最后一字为识别标准)。7-5:年。7-6:月。7-7:星期。7-8:日。7-9:时。7-10:刻(包括时刻、一刻,以最后一字为识别标准)等。7-11:分。7-12:秒。等

【操作程序】

由于4号介词库的很多介词也能够与时间介词配套,因此在检索6号方位词库结束后,如果找不到配套的方位词,程序就可以接着转到7号时间词库检索。检索方式与前面相同。

如果检索没有结果,还可以转入其它词库进行检索。

如果检索找到配套词汇,则分割出相应的字符串。再计算输入语句的未被分词字数,如果其数字等于零,表明该语句分词检索已经结束。转入分析语义操作,或是转入下一语句的分词了。

这里要照顾到总程序的安排,如果总程序安排把一个语句分析到底,当然要转入语义分析(语义识别)。如果总程序安排先把所有语句分割成分词状态,再进行语义分析,自然就要转入下一语句的分词了。

【词库介绍】

这个词库是时间介词库,由于4号介词库有大量词汇也可以表示时间,故专门用于表示时间的词汇很少,但是为了检索的方便,我们还是为它们专设了一个介词库,标号为8。有8-1:当。8-2:经过。8-3:定于。8-4:原定于。8-5:为期。等。 

【操作程序】基本操作与以前一样。它的前期操作一般由4号介词库检索失败而来,检索到8号词库的介词后,也要进入8号词库介词检索程序。

【词库介绍】这里是8号时间词库的校验词库。这个词库标号为9。其中的词汇标号为9-X。被校验的主角是“当”,其它双字介词产生歧义的机会很小,但是也要考虑。

其歧义词汇也分三类:第一类是前方歧义,第二类是后方歧义,第三类是双向歧义。

【操作程序】

校验操作与4号介词库类似,也是分两个方向检索歧义。检索出歧义,优先确定分词为9号词库的歧义词汇。检索无歧义,确定为8号介词库介词。

确定为介词后。程序转入7号时间词库,由8号介词库的词汇起,向后检索配套词汇。检索到配套词汇后,把8号介词库的介词与7号时间词库的配套时间词,以及其中所夹的所有字符分割出一个字符串,作为分词结果。

在完成本段所介绍的两个阶段分词以后,分词程序转入下一个介词分词阶段。我们将另开一段介绍。

我还是建议对分词过程的介词和时间词进行标注,以便以后分析语义时使用,而不必在重新进行检索。


免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈