首页 理论教育 语料库检索平台的设计

语料库检索平台的设计

时间:2022-04-07 理论教育 版权反馈
【摘要】:为方便查询,本项目设计了一个基于Web的图形化的语料库检索平台。该检索平台主要实现以下功能:较强的语料库检索功能。检索结果的呈现多样性。如管理员可以检索语料库中所有资源、追加语料、保存检索结果和管理平台所有用户;教师可以访问特定数量的语料、保存检索结果;学生只能检索特定数量的语料;游客在检索功能上还进行一定限制等。

为方便查询,本项目设计了一个基于Web的图形化的语料库检索平台。用户根据需要直接选择或输入待查询内容,后台接收用户请求后即可自动生成SQL语句实现对数据库中语料的访问和检索,将返回结果处理后呈现给用户。该检索平台主要实现以下功能:

(1)较强的语料库检索功能。该检索平台可以提供针对英汉的通配符的模糊检索,带词性和不带词性的检索,以及灵活的正则表达式检索。相对于常用的通配符检索,正则表达式检索更能保证检索的正确率,也更灵活、有针对性。

(2)多检索条件的限制。该检索平台将语料中的元数据赋码作为检索条件供用户选择或输入,包括源语言、文类、文体、体裁、作者、译者、出版社、出版年份、所属时代以及大小写是否敏感。多种条件可以单独或结合使用。

(3)检索结果的呈现多样性。检索结果中匹配字符串以红色凸显,显示每个句对的英汉句数对比,并进行词频统计,除此之外,还可以选择显示句对的单词词性和句对来源。

(4)安全的访问控制。该平台针对不同级别的用户提供不同的检索能力,用户分为四种级别:管理员、教师、学生和游客,其访问权限依次减小。如管理员可以检索语料库中所有资源、追加语料、保存检索结果和管理平台所有用户;教师可以访问特定数量的语料、保存检索结果;学生只能检索特定数量的语料;游客在检索功能上还进行一定限制等。

本检索系统基于Oracle数据库,采用Apache Tomcat作Web服务器,前台采用JSP和Ajax技术,后台采用JAVA语言编程设计开发了一个基于Web的语料库检索平台。用户自身的计算机不需要任何安装和配置,在联网的情况下通过浏览器即可访问。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈