语义网的产生

时间：2023-02-27 百科知识版权反馈

【摘要】：语义Web也被网格研究者们纳入信息服务网格的研究范围。语义网的基本思想是提供基于机器可处理的数据语义，并应用这些元数据的启发式进行自动化的信息访问［3］。数据语义的显性表示和领域理论（本体）将使得Web提供一种全新质量的服务。值得一提的是，在Web领域最高的国际会议WWW上，语义Web研究也逐渐显示出其重要地位。

语义网的产生_领域本体的半自动构建及检索研究

1.1　语义网的产生

1.1.1　语义网的提出

1990年，蒂姆·伯纳斯·李（Tim Berners－Lee）发明了互联网上的超文本系统，使网络互联技术用于人们的信息交流与共享，从而极大地促进了互联网的发展。现在，互联网已经成为人们进行信息交流的重要工具。人们可以通过互联网来寻找自己关心的信息，也可以通过互联网来将自己的信息发布出去。但随着互联网应用的不断扩展，现有互联网技术的局限也逐渐暴露出来。现有互联网技术的核心是超文本系统，它的主要思想是通过统一资源标识符（URI：Uniform Resource Identifier）对互联网上的信息进行标记，使人们可以迅速地对互联网上的信息资源进行定位。然而，现有互联网技术并没有对信息的含义进行描述，计算机在处理信息时只是按照URI来定位信息，但对信息的内容并不关心。而人们真正关心的是信息的内容，也就是互联网上的文本、图片等资源所包含的意义。由于现有互联网技术的局限，互联网上信息处理的自动化、智能化程度是很低的，计算机处理器的强大功能也没有得到有效利用。

互联网技术的研究者正在研究新的技术以改变这种状况，而其中最令人瞩目的就是语义Web技术。语义Web是互联网研究者对下一代互联网的称谓，通过扩展现有互联网，在信息中加入表示其含义的内容，使计算机可以自动与人协同工作。也就是说，语义Web中的各种资源不再只是各种相连的信息，还包括其信息的真正含义，从而提高计算机处理信息的自动化和智能化。而计算机并不具有真正的智能，语义Web的建立需要研究者们对信息进行有效的表示，制定统一的标准，使计算机可以对信息进行有效的自动处理。

在2000年的世界XML（Extensible Markup Language）大会上，万维网创始人蒂姆·伯纳斯·李做了题为Semantic Web的演讲，对语义Web的概念进行了解释，并提出了语义Web的体系结构。2001年5月，Scientific American封面文章发表了蒂姆·伯纳斯·李的“The Semantic Web”一文，描绘了语义Web的美好前景，并对其中的主要技术进行了简明的介绍。语义Web也被网格研究者们纳入信息服务网格的研究范围。据美国《福布斯》杂志预测，网格技术将在2004—2005年出现一个高峰，推动信息产业市场的持续高速发展，在2020年产生一个产值为200 000亿美元的大工业。而语义Web正是网格技术中信息服务网格技术的基础，在网格技术的研究中占有极其重要的地位。

鉴于语义Web研究的重要价值，国外的很多大学、研究机构、大公司都成立了专门的项目组来推动这项技术的发展，W3C （World Wide Web Consortium）组织也成立了专门的工作组来推动语义Web技术的发展。2001年7月30日，在斯坦福大学召开了题为Infrastructure and Applications for the SemanticWeb的学术会议。2002年7月9日，在意大利召开了1st International Semantic Web Conference会议。国内这方面的研究刚刚起步，2002年，中国的863计划将语义Web技术列为重点支持项目。

当前，语义Web作为信息技术的一个热点，得到了研究者们极大的关注，也得到了许多政府、科研机构及商业部门的投入，近几年必将得到较大的发展。

1.1.2　什么是语义网

所谓“语义”就是文本的含义。语义需要理解文本的意思和结构，而与显示方式无关。语义网就是能够根据语义进行判断的网络。目前在万维网中，网页仅仅是一个单调的内容显示，电脑只负责将一个网页链接到另一个网页，网络不能按照用户的要求自动搜寻和检索网页，直至找到所需要的内容。而语义网则是希望计算机能“看懂”网页的内容，使计算机成为“智能”的导航工具。当然语义网还并不仅仅能完成这个功能，它比这还要“聪明”得多。简单地说，语义网是一种能理解人类语言的智能网络，它不但能够理解人类的语言，而且还可以使人与电脑之间的交流变得像人与人之间的交流一样轻松。

Tim等人所倡导的语义Web定义为：“语义Web不是产生一种新的Web，而是针对现有Web的扩展，Web中的信息语义被良好定义，使人与人、人与计算机之间能够更好地协同工作。”语义Web不仅仅是为了共享资源，进一步希望人们共享知识，这种网络环境下的知识共享能够发挥比个人拥有知识更大的作用；其次，目前海量的网页数据中，有近80%的内容来源于数据库中的数据，因此在万维网中共享的不是网页内容，而是数据内容的集成和共享。因此在语义Web中，处理的对象不再是以超级链接连接的页面文本，而是具有一定语义超链接的数据内容；进而，万维网成为一个语义关联的数据网络，人们能够像使用数据库那样在万维网上获取到所需的知识。

语义网的基本思想是提供基于机器可处理的数据语义，并应用这些元数据的启发式进行自动化的信息访问^［3］。数据语义的显性表示和领域理论（本体）将使得Web提供一种全新质量的服务。其最终目标是将人类知识编织成一个巨大的网络，并以机器处理的方式来实现它。各种自动化服务将帮助用户以机器可理解的格式访问和提供信息，并使得计算机自动化处理过程和Web信息集成更为方便。

在2001年斯坦福大学召开的语义Web国际研讨会之后，有了每年一度的语义Web国际会议（ISWC）。此后，欧洲语义Web国际会议（ESWC）和亚洲语义Web国际会议（ASWC）也相继在2004年和2006年开始组织，并受到研究者的广泛关注和参与。值得一提的是，在Web领域最高的国际会议WWW上，语义Web研究也逐渐显示出其重要地位。在2007的WWW会议中，语义Web相关文章达到了16篇（包含社会网络）。数据库领域国际会议中涉及语义Web的论文也呈逐渐增多的趋势，在VLDB 2007国际会议中，语义Web相关技术论文“Scalable Semantic Web Data Management Using Vertical Partitioning”获得了大会最佳论文奖。

与此同时，很多大的国际信息技术企业都已经或正在开始提供语义Web相关工具，包括：语义内容存储、基于Web上语义标识语言的推理器、异构数据转换器、语义Web搜索引擎、语义内容浏览器等。这些为语义Web的广泛应用奠定了良好的基础。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈