首页 理论教育 域名地址和网页标识语言介绍

域名地址和网页标识语言介绍

时间:2022-10-13 理论教育 版权反馈
【摘要】:域名地址的结构域名地址由计算机名、组织机构名、网络类型名、最高层域名构成。目前,所有全球顶级域名注册总数已达1.84亿,其中.com为全球最受欢迎的顶级域名。目前,大多数域名争议都发生在com的顶级域名下,因为多数公司上网的目的都是为了赢利。而行政区域名有34个,分别对应于我国各省、自治区和直辖市。

10.2.1 域名地址(Domain Name Address)

(1)域名地址的定义

域名是网络主机的字符型标识。由于IP地址难以记忆,因此一般使用域名。当使用域名访问网络资源时,要经过一个称为域名解析器的服务器将域名转换成IP地址。

域名地址是以主机(host)、子域(sub domain)和域(domain)的文字形式表示的Internet地址(address),与以数字表示的IP地址(IP address)相对应。

电脑在网址栏里面键入域名地址后,由DNS服务器将域名地址翻译为该域名所对应的IP地址,才能正常连接目标服务器。

域名同时与统一资源定位器(Uniform Resource Locator,URL)相关联。URL由4个部分组成,即协议、站点服务器(域名或者IP地址)、路径及文件名。例如,一个URL地址为

http://www.microsoft.com/frontpage/productinfo/default.htm

其中,站点服务器的名称www.microsoft.com就是域名。

(2)域名地址的结构

域名地址由计算机名、组织机构名、网络类型名、最高层域名构成。域名的结构由这些分量组成,各个分量之间用点隔开,例如:

……三级域名.二级域名.顶级域名

各分量代表不同级别的域名,级别最低的域名写在最左边,级别最高的顶级域名则写在最右边。完整的域名不能够超过255个字符,一个域名可以包含下级域名的数目并没有明确的规定,各级域名由各自的上一级域名管理机构管理,而最高级的顶层域名则由因特网的有关机构管理。

1)顶层域名

域名右边第一组字母称为顶级域名。顶级域名有两种表示法:美国的主机大多采用3个字母的机构分类代码,其他国家一般采用两个字母的国家或地区代码(见表10.1)。例如,太平洋电脑网数码相机频道的域名dc.pconline.com.cn中的dc代表Web服务器, pconline.com.cn是服务器站点的名称,其中.cn是顶级域名,.com.cn是二级域名。

表10.1 顶层域名表

根据2008年6月国际互联网名称与数字地址分配公司(ICANN)第23届巴黎年会通过的一项决议,2009年起放开对互联网域名注册的限制,届时,无论是公司还是网民都可以自由注册个性化的域名,如后缀为.amour(法文,意思为爱)的域名。

新的域名将不再局限于英文字母,该组织已测试了包括中文在内的15种语言,这意味着诞生于1983年的域名系统(Domain Name System,DNS)在被英语“独霸”25年之后将真正迎来包括中文在内的世界各大语种顶级域名时代,“.中国”将成为首批新设的非拉丁语系字符顶级域名之一。

目前,所有全球顶级域名注册总数已达1.84亿,其中.com为全球最受欢迎的顶级域名。

目前,大多数域名争议都发生在com的顶级域名下,因为多数公司上网的目的都是为了赢利。为加强域名管理,解决域名资源的紧张,Internet协会、Internet分址机构及世界知识产权组织(WIPO)等经过广泛协商,在原来3个国际通用顶级域名:(com)的基础上,新增加了7个国际通用顶级域名:firm(公司企业)、shop(商店)、web(突出WWW活动的单位)、arts(突出文化、娱乐活动的单位)、rec(突出消遣、娱乐活动的单位)、info(提供信息服务的单位)、nom(个人),并在世界范围内选择新的注册机构来受理域名注册申请。

2)二级域名

二级域名是指顶级域名之下的域名,它是指域名注册人的网上名称,如ibm,yahoo,microsoft等;在国家顶级域名下,它是表示注册企业类别的符号,如com,edu,gov,net等。

我国在国际互联网络信息中心(InterNIC)正式注册并运行的顶级域名是CN,这也是我国的一级域名。在顶级域名之下,我国的二级域名又分为类别域名和行政区域名两类。类别域名共6个,包括:用于科研机构的ac;用于工商金融企业的com;用于教育机构的edu;用于政府部门的gov;用于互联网络信息中心和运行中心的net;用于非营利组织的org。而行政区域名有34个,分别对应于我国各省、自治区和直辖市。

3)三级域名

三级域名用字母(A~Z,a~z)、数字(0~9)和连接符(-)组成,各级域名之间用实点连接,三级域名的长度不能超过20个字符。如无特殊原因,建议采用申请人的英文名(或者缩写)或者汉语拼音名(或者缩写)作为三级域名,以保持域名的清晰性和简洁性。

(3)什么是域名地址服务器

域名地址服务器简称为域名服务器,是英文Domain Name Server的缩写。每一个域名都至少要有两个DNS服务器,这样如果其中一个DNS服务器出现问题,另外一个也可返回关于这个域名的数据。

在DNS服务器中保留有该域名的DNS记录,如A记录、MX记录。A记录是用来指定主机名(或域名)对应的IP地址。MX记录用来解析域名的邮件服务器。在很多情况下,当一个浏览者在浏览器地址框中打入某一个域名,或者从其他网站单击了链接来到了这个域名,浏览器向这个用户的上网接入商发出域名请求,接入商的DNS服务器要查询域名数据库,看这个域名的DNS服务器是什么。然后到DNS服务器中抓取DNS记录,也就是获取这个域名指向哪一个IP地址。在获得这个IP信息后,接入商的服务器就去这个IP地址所对应的服务器上抓取网页内容,然后传输给发出请求的浏览器。

就像我们初次拜访一个人一样,我们要知道人家的门牌号,然后按照地址去找。在Internet上只知道某台机器的域名还是不够的,还要有办法去找到那台机器。寻找这台机器的任务由域名服务器来完成,而完成这一任务的过程就称为域名解析。

域名解析不需要很长时间,是因为上网接入商,如北京电信等,为了要加速用户打开网页的速度,通常在它们的DNS服务器中缓存了很多域名的DNS记录。这样当这个接入商的用户要打开某个网页时,接入商的服务器不需要去查询域名数据库,而是把自己服务器缓存中的DNS记录直接调用,从而加快用户访问网站的速度。

10.2.2 互联网网页标识语言

(1)什么是标识语言

互联网网页标识语言是一种计算机标识语言。标识语言(Markup Language)是电子环境下发展的一种利用特定的文本句法描述信息资源的格式成分、结构信息、特征等的语言。标识语言最早出现在文件排版时,用来指示文字如何编排的指令,标识并不处理文件的内容,主要用来处理文件的显示外观或样式,如字体大小、黑体、斜体、颜色等,这类标识称为程序性标识(Procedural Markup)。一般而言,程序性标识的作用部分只针对单一文件。

另一类标识称为描述性标识(Descriptive Markup),也称为通用标识。它所描述的是文件的内容(content)或结构(Structure),而不是文件的外观或样式,制订SGML的基本思想就是把文档的内容与样式分开。XML,SGML都是典型的通用标识语言。HTML比较特殊, HTML的标签集(tag set)中的大部分都是用来设定文件在Web上的呈现外观,少部分描述文件的结构(如head,title,body)。但是,由于HTML是SGML的一种应用,因此HTML并非程序性标识语言,而是以描述性标识的方式来控制文件外观显示。

(2)标识语言的种类

这里介绍3种相关的网页标识语言:SGML(Standard Generalized Markup Language)标准通用标记语言、HTML(Hypertext Markup Language)超文本标记语言、XML(Extensible Markup Language)可扩展标记语言。

1)SGML

SGML是一种通用的文档结构描述标识语言,主要用来定义文献模型的逻辑和物理类结构。ISO组织于1986年发布的关于SGML的ISO 8879国际标准,将它作为通用的描述各种电子文件的结构及内容的国际标准。SGML从两个层次——结构和内容来描述文献,其核心是文献类型定义(Document type Definition,DTD)。

具体的一个SGML语言程序,主要由3部分组成,即语法定义、文献类型定义和文件实例。语法定义,定义了文献类型定义和文件实例的语法结构;文献类型定义,定义了文件实例的结构和组成结构的元素类型;文件实例,是SGML语言程序的主体部分。

简言之,SGML是一个庞大复杂的系统,它不仅是一种电子文献格式,更重要的是,它是一种有坚实理论基础的强大技术,其应用的核心是对文献的结构进行描述,即文献类型的定义(DTD)。

2)HTML

超文本标识语言是一种专供网页制作的标识语言,是在SGML定义下的一种描述性的语言,或者说HTML是SGML的一个应用程式。其特点是简洁。也正是因其简洁性,使其在Internet网上得到迅速推广。

普通文本文件和印刷型文献的内容是线形排列的,知识点之间固有的网状联系无法体现。在超文本文件中,文本中的某些内容通过被称为链接项(由高亮度、下画线或编号来标识)或超链接的一些词和其他文本或文件连接起来,也就是说,超文本文件是一种含有多个指向其他文本、图像、声音或动画文件的指针,并使它们连接在一起的文件。超文本标识语言通过链接项链接文件与文件,或者文件内部的不同部分,由此实现在Internet上的漫游。

一个HTML文件通常由文件头(head)、文件名称(title)、表格(table)、段落(paragraph)、列表(list)等部分构成。下面是一份HTML文件的最基本架构:

<html>

<body>

<p>

<a href=“http://www.blabla.cn”target=_blank>布啦布啦站点链接</a>

</p>

</body>

</html>

将上面的程序写入FrontPage后运行,就会在屏幕上显示一个“布啦布啦站点链接”的超链接,单击这个超链接就能访问blabla.cn——一个网页教程和代码网站。

3)XML

1996年11月,在波士顿SGML年会上,新的数据描述语言——可扩展标记语言(XML)公布于世,并向W3C(万维网协会,the World Wide Web Consortium)正式提案。1998年2月, W3C正式推出XML 1.0版本,XML从此正式诞生。

XML是一种简单的SGML,它保留了SGML可扩展性、结构以及数据确认方面的主要优点,可支持建立用户定义Web文件类型,对SGML的某些内部数值和参数进行了重新定义,省略了SGML中许多复杂而少用的部分。XML以20%的SGML难度实现了SGML 80%的功能。

XML不是一种编程语言,它和SGML一样是一种元语言。XML具有以下优点:

①XML能直接用于Internet。

②XML与SGML兼容。

③编写处理XML文件的程序简单。

④XML的可选特征项尽量少。

⑤XML文件清晰且易于阅读。

⑥XML设计尽量规范、简洁。

XML文件可通过多种媒体形式表示出来,它可在计算机、蜂窝电话上显示,也可转化为声音。因此,XML文件可独立于Internet存在,最大限度地服务于出版业,特别适用于那些想把信息发布在各种媒体上的出版商。一些大规模地使用SGML的出版商可能最终都会转向XML,而且XML的平台无关性也将对Web产生巨大的影响。

(3)XML,HTML和SGML三者之间的关系

XML和HTML都是从SGML演变而来的文件格式,它们有很多相似之处,但是,HTML 是SGML的一种应用,而XML却是SGML的一个子集。这样HTML不能再定义新的应用, 而XML则可以,如RDF(Resource Description Format)和CDF(Channel Description Format)都是XML的应用。XML与SGML兼容,任何XML文件都能被SGML工具识别,而XML比SGML简单,更适合于带宽不是很高的Internet应用。因此,XML发扬了SGML的优点,而且变得更简单,能更好地应用于Web。

SGML,HTML和XML这三者之间没有相互取代的关系,它们各得其所,HTML仍是短、小信息(如会议日程安排等)发布者的青睐对象,XML将更多地应用于一些数据多、时间长、结构较复杂的信息发布,而SGML由于没有设计成符合网络协议的需求,在Internet下应用不多,它更多地应用于结构很复杂的文件。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈