2.1 域名简介
2.1.1 域名的起源
了解一个东西就要了解它的起源,域名亦是如此。在互联网的世界里,计算机之间通信是有协议的,而在Internet上,则使用互联网协议(Internet Protocol, IP)来区分每一台计算机,现在普遍使用第四个版本IPv4,它是由一串32位的二进制代码组成的。每个IP在世界上都是唯一的,没有两个相同的IP,我们可以通过IP来访问固定的计算机。因二进制的IP共有32位数字,不方便记忆,于是又把二进制的IP分成四段,每段分别转换成0~255的十进制数,就减少了需要记忆的字符。
例如,23.96.52.53,这是Microsoft公司的IP,但是有谁能记住它呢?即便转换成了十进制IP地址,仍是不易记忆,于是又发展出了一套与IP对应的符号体系来帮助人们理解和记忆,这套符号体系被称为域名。并且域名跟IP一样,每一个都是独一无二的。我们通过IP“23.96.52.53”与域名microsoft.com都可以访问到Microsoft公司的网站。
1983年,现代Internet的奠基者之一保罗·莫卡派乔斯博士(Paul V. Mockapetris)发明Domain Name System(DNS域名系统),为域名解析服务。他1971年从麻省理工学院取得电机与物理两个学士学位,而他的资讯与计算机科学博士学位则是在1982年于加利福尼亚大学欧文分校获得的。DNS规定域名由26个英文字母a~z(不区分大小写)、阿拉伯数字0~9和符号“-”“.”组成。如阿里巴巴公司网站的域名是:alibaba.com。
域名可以通俗地比喻成网站在Internet上的门牌号,方便人们更快地找到网站。IP相当于经纬度,但即使给出精确的经纬度,别人也不一定能找得到。如图2-1所示,IP的4组数字放在门牌号中,可以理解为国别、区号、小区号、房号,这样就是现实版的IP地址,但是谁能记住你家这么一长串数字呢?而用一个有意义的名字代替就很好记了。比如Tom's home,当然这个不是唯一的,可能在小范围里是唯一的。
图2-1 阿里巴巴域名IP解释图
域名,又被称为网址,就计算机专业术语来说,两个概念是有区别的。域名microsoft.com对应的网址是http://www.microsoft.com。当建立一个www的主机后,并以域名为其命名,主机的名字就为www.域名,假如访问这台主机,浏览器会以指定的http(Hypertext Transfer Protocol)协议向主机发出数据请求。为此,我们描述一个完整的网址时都会在主机前加上“http://”。正因如此,我们才把域名投资说成网址投资。
2.1.2 域名的构成
怎样才算是一个完整的域名呢?以一个常见的域名为例说明,腾讯企业官方域名由两部分组成,标号“tencent”是这个域名的主体,而最后的标号“com”则是该域名的后缀,代表这是一个com国际域名,是顶级域名,完整的就是“www.tencent.com”。
域名系统是分层的,允许定义子域。域名组成中至少有一个标签。如果有多个标签,必须用点分开。在一个域名中,最右边的标签,必须从列表中选择名称的顶级域名,也被称为顶级域(中英文顶级域名或TLD)。标签上有一些限制。
2008年,在巴黎召开的ICANN会上,理事会一致通过决议,允许使用其他语言作为互联网顶级域名的字符。但其他字符的域名不具备国际性,不利推广,所以一直未能大面积应用。而后也有一些国家纷纷开发使用本民族语言构成的域名,如德语、法语等。中国也有人使用中文域名,但是在中国国内相当长的时期内,以英语为基础的域名(英文域名)仍然是主流。
英文域名格式如下:域名由各国文字的特定字符集、英文字母、数字及“-”(即连字符或减号)任意组合而成,但开头及结尾均不能含有“-”;域名中字母不分大小写;域名最长可达67个字节(包括后缀.com、.net、.org等)。中文域名格式如下:各级域名长度限制在26个合法字符(汉字,英文a~z, A~Z,数字0~9和“-”等均算一个字符);不能是纯英文或数字域名,应至少有一个汉字,“-”不能连续出现。
从Internet的发展上来说,域名的重要性还体现在IPv4版本的IP地址日渐枯竭,IP协议开始过渡到IPv6版本,IPv6能提供更多的IP地址,但也更难记住。我们可以从图2-2中直观地了解两个版本的区别,IPv6发展起来之后,互联网对域名越来越依赖,域名的需求量也会更大。
图2-2 IPv6和IPv4对比