首页 百科知识 词汇转换模式的基本原理

词汇转换模式的基本原理

时间:2022-02-27 百科知识 版权反馈
【摘要】:完全同义词转换的基本原理是根据各词表提供的同义词关系,系统转换出各源词表用作正式叙词的词汇。也就是说,在转换过程中,用户输入的转换词级别最高,即与用户的检索需求主题最为接近。
转换模式_情报检索语言的兼容转换

2.3.2 转换模式

(1)完全匹配

完全匹配并没有实现叙词表之间的转换,而是各词表之间本身的兼容性。用户输入的转换词必须作为正式叙词在词表中出现。这种匹配只提供以该词为正式叙词的词表。例如“钞票”在《社科表》和《经管表》中作为正式叙词出现,而在《汉语主题词表》不作为正式叙词出现。例如:

输入转换词:钞票

显示转换结果:钞票 社

       钞票 经

(2)完全同义词转换

狭义的同义词仅仅指在某一词表中具有“用”“代”关系的词汇。但是,对于多个词表来说,由于各表的编辑人员和收词原则并不完全相同。同一词汇在不同词表中可能与不同的词汇具有“用”“代”关系,因而这些词汇可以根据各表提供的参照集中起来,构成同义词网络,所有同义词集合称作“完全同义词”(见图2-3)。

img13

图2-3 完全同义词转换模式

A为用户输入的转换词;

B1,B2,B3为A词在某些词表中的正式叙词;

C2为B3词在某些词表中的正式叙词;

C1为B2词在某些词表中的正式叙词;

F1为E3词在某些词表中的非正式叙词;

F2为E2词在某些词表中的正式叙词;

E1,E2,E3为A词在某些词表中的非正式叙词。

完全同义词转换的基本原理是根据各词表提供的同义词关系,系统转换出各源词表用作正式叙词的词汇。也就是说,在转换过程中,用户输入的转换词级别最高,即与用户的检索需求主题最为接近。如果某一个词汇在一部词表中可能有多个不同级别的转换结果,则只选取级别最高的转换结果。转换模式遵从以下由高到低的优先次序:

●级别1:A

●级别2::A→B1,B2,B3

●级别3:B1,B2,B3→C1

●级别4:C1→E1,E2,E3

●级别5:E1,E2,E3→F2

●级别6:F2→C2

●级别7:C2→F1

转换模式可分解为六种情况。下面以表2-5中数据为例进行详细说明。

表2-5 集成词表示例

img14

续表 2-5

img15

第①种模式:A与B1词在甲词表中为同义词,B1为正式叙词,则B1为甲词表的转换结果。如果A在乙词表中为非正式叙词或不存在,而B1为正式叙词,则以B1为乙词表转换结果。如果A在乙词表中为正式叙词,则以A为转换结果。例如:

img16

输入转换词汇:出口信贷(A)

img17

img18

第②种模式:B2词在乙词表与C1词为同义词,C1为正式叙词,则以C1作为乙词表的转换结果。如果A和B2词在丙词表不出现,而C1词在丙词表为正式叙词,则以C1词作为丙词表的转换结果。例如:

img19

输入转换词汇:出口信用国家担保(A)

img20

img21

第③种模式:B3词在乙词表与C2词为同义词,C2为非正式叙词,则以B3为乙词表的转换结果。如果A和B3在丙词表不作正式叙词,而以C2词为正式叙词,则以C2词为丙词表的转换结果,如果A、B3或C2词在丙词表均为正式叙词,则依优先级别选取最终转换结果。例如:

img22

输入转换词汇:国际信用(A)

img23

第④种模式:A与E1词在甲词表中为同义词,E1为非正式叙词,则A为甲词表的转换结果。如果A在乙词表中不作正式叙词,而以E1为正式叙词,则以E1为该词表转换结果。如果A在乙词表中为正式叙词,则以A该为转换结果。例如:

img24

输入转换词汇:国际贷款(A)

img25

第⑤种模式:E2词在乙词表与F2词为同义词,但以F2为正式叙词,则以F2作为乙词表的转换结果。如果A、E2或F2词在丙词表均用作正式叙词,则依优先级别选取。例如:

img26

输入转换词汇:国际投资(A)

img27

第⑥种模式:E3词在乙词表与F1词为同义词,以E3为正式叙词,则以E3作为乙词表的转换结果。如果A和E3词在丙词表不为正式叙词,而以F1词在丙词表为正式叙词,则以F1词作为丙词表的转换结果,如果A、E3和F1同时为丙词表正式叙词,则依优先级别选取。例如:

img28

输入转换词汇:对外投资(A)

img29

完全同义词转换虽然可分解为上述六种情况,但在通常情况下,某个词汇的完全同义词转换可能涉及其中的若干种情况,所以进行转换操作时,必须严格遵循优先次序。例如:

输入转换词汇:国外贷款

img30

(3)相关词转换

相关转换包括三种情况:

①属项转换:如A在P1词表中出现,在P2词表中不出现,但A属C词,C词在P2词表中作为正式叙词出现。则视A与C相关。例如:

img31

输入转换词汇:代币

img32

②相关参照转换:指完全同义词转换结果所对应的所有属项、分项和参项参照对应的词汇。

③其他转换:指完全同义词转换过程中未被正式选为转换结果的词汇。例如:

输入转换词汇:出口信用国家担保。

img33

img34

部分叙词表转换结果如表2-6所示。

表2-6 叙词表转换示例

img35

续表 2-6

img36

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈