首页 理论教育 语义网的基础和核心

语义网的基础和核心

时间:2022-02-27 理论教育 版权反馈
【摘要】:语义网的基础包括三个方面,即技术基础、知识基础和逻辑基础。因此,语义网的核心就是对语义的揭示与表达。本体的研究是人工智能长期进行的一项难题,其中本体的自动构建、不同本体之间的匹配、本体的自动演化问题是近几年本体研究的热点,也是语义Web研究中的热点问题。
语义网的基础和核心_领域本体的半自动构建及检索研究

1.3 语义网的基础和核心

1.3.1 语义网的基础

通过对语义网体系结构各层含义以及它们之间逻辑关系的分析,可以看出该体系结构所体现的语义网的基础和核心。语义网的基础包括三个方面,即技术基础、知识基础和逻辑基础。

·技术基础

语义网体系结构各层的内容共同构成了语义网的技术基础。该体系结构的每一层都包含了为实现语义网构想所必需的一系列技术,不同的技术层完成不同的功能。简单地说,Unicode和URI技术层负责完成Web资源的编码和定位;XML+NS+xmlschema技术层负责提供结构化的语法;资源描述和本体层负责Web上的数据、资源和知识的表示;逻辑、证明和信任层负责提供语义网所需要的规则、推理和验证。各层逐级扩展,相互融合、补充,为实现语义网构想提供了坚实的技术基础。

·知识基础

从抽象的观点看,语义网就像是一个大的知识表现系统。语义网可以描述三个层次的知识类型:事实性知识、术语知识和推理知识。

事实性知识是对客观实在的简单陈述,如由XML标签描述的信息、由RDF三元组描述的一个简单陈述等,这类知识简单清晰、一目了然。

术语知识是指由本体所描述的关于概念以及它们之间关系的语义信息。术语知识可以描述比事实性知识更加复杂的语义和对象信息。对于开放式的Web而言,它更加适合描述那些不同种类、分布式的结构化或半结构化信息。

推理知识是指那些隐藏在事实性知识或术语知识之中的需要借助一定的推理规则才能获得的隐性知识。例如,对于事实性知识“Nimo的父亲是Tom”和“Tom和Jack是兄弟”,虽然我们可以很容易地推断出Jack是Nimo的叔叔,但对于计算机而言,只有通过相应的规则定义才能得出这一推理知识。

·逻辑基础

只有通过形式化的方法才能显性地揭示和描述语义网中的语义,因此必须借助强有力的形式化工具——逻辑。实际上,语义网的描述语言包括RDF和OWL都可以看做是谓词逻辑的特殊形式,因为它们与谓词逻辑之间以逻辑公理的形式存在着语义上的对应关系。其核心是为了实现机器的“理解与处理”。在语义网的三个基础层面中,技术基础是该体系结构所直接体现的基础层面;知识基础和逻辑基础则是隐藏在该体系结构中间接体现的深层次的基础层面。语义网将在网页中加入方便机器“理解和处理”的内容,并为人们提供各种智能服务。因此,语义网的核心就是对语义的揭示与表达。

1.3.2 语义网实现的关键技术

(1)元数据获取

目前,Web内容是按照让人读懂而不是让机器读懂的方式组织的,Web语言主要是HTML,HTML只负责数据的显示方式而不关心数据的内容。元数据是关于数据的数据,它的作用是以一种机器可以处理的方式来描述Web的内容。比如Web中一篇文章的标题用<标题>标记,文章的作者用<作者>标记,文章的内容用<段落>标记,那么标记<标题>、<作者>、<段落>就是Web中这篇文章的元数据。XML是目前使用最多的元数据表示语言,它允许各组织和个人建立适合自己需要的标记集合(元数据集合),并且这些标记可以迅速地投入使用。

(2)本体

用XML表示的元数据可以由各组织和个人建立,在Web中就存在同一个元数据表示不同的含义和不同的元数据表示相同含义的问题,语义Web采用本体技术来解决这一问题。本体是领域共享概念的明确的形式化规范说明。

不同的领域和应用根据领域知识建立起自己的本体,即用本体描述语言描述共享概念及概念之间的关系,使这些概念表示明确的语义。

本体中的主要元素包括概念(也称类)、属性、实例、关系和公理。概念是共享概念的定义,属性用来描述概念所具备的性质,实例是概念的具体化,是符合某个概念属性的对象,关系用来描述不同概念之间的相互联系,公理是领域中的规则。

W3C根据技术发展,提出了针对语义Web的本体语言栈。由下向上分别是RDF、OIL(Ontology Inference Layer)、DAML (DARPA Agent Markup Language)以及OWL。目前OWL是W3C推荐的标准。RDF模式RDL提供了定义词汇表,是一种分类的结构,RDF-S对描述资源的元数据进行约束,从而扩展了RDF的表达能力。OIL是RDFS的一个扩展,通过XML的文档类型定义来增加定义完善的语法实现,DAML是Web本体论的扩展,允许语言表达规则。OWL是目前W3C组织推荐的本体描述语言,其目的在于提供一种语言以描述嵌在Web文档和应用中的类及这些类之间的关系。OWL相对于XML和RDFS拥有更多的机制来表达语义,从而超越了XML和RDFS仅仅能够表达网上机器可读的文档内容的能力。

本体的研究是人工智能长期进行的一项难题,其中本体的自动构建、不同本体之间的匹配、本体的自动演化问题是近几年本体研究的热点,也是语义Web研究中的热点问题。

(3)逻辑

逻辑提供了知识的形式化表示方法,也提供了从已知的知识推出未知知识的推理机制。利用逻辑推理,我们可以知道本体所表示的知识库中隐含的知识,隐含的关系,以及判断本体中的知识是否互相冲突,检验本体的一致性。描述逻辑(Description Logic)是本体描述语言OWL的逻辑基础,它是一阶谓词逻辑的可判定子集,能够提供可判定的推理服务,并且具有语义特征。在经过二十多年的研究与发展之后,描述逻辑已经基本趋于成熟并走向应用,它是知识表示的形式化工具。但是描述逻辑主要还只能处理静态的知识,在对动态世界的表示与推理上却无能为力,尤其是对智能主体的内部知识库的表示显得乏力,也不能对服务的动态性与交互性进行刻画。动态逻辑最开始是用来进行程序正确性验证的,后来人们也用它来对动态世界进行表示与推理,有的也用在逻辑程序设计上。它们能对动作、状态、动态关系进行较好的刻画,在静态知识上的表达力却很弱,且推理较为复杂。如何将动态与静态结合起来,这是需要研究的关键问题。

(4)智能主体

智能主体是分布式环境下软件智能化的重要技术。自20世纪50年代就已经提出,但真正的发展是在20世纪80年代之后,在20世纪90年代成为研究的高潮,直到现在仍然是人工智能研究的热点。现在关于智能主体的研究主要侧重在以下几个方面:主体的认知模型和理论、多主体系统的体系结构、主体的协作与协商、面向主体的软件方法学以及主体技术的应用等。经过二十多年的研究,主体的理论与技术有了长足的发展,已经在很多领域中得到了应用。而对于用户来讲,语义网应该提供一种丰富完善的服务,一种在知识表示与推理之上的服务,这些服务由具有智能的主体来提供。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈