
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
4.10.1 为什么出现不规范网址
举例来说,下面这几个URL一般指的是同一个文件:
●http://www.domainname.com/index.html
http://domainname.com/index.html从技术上来讲,这几个URL都是不同的网址,搜索引擎也确实把它们当作不同的网址。虽然在绝大部分情况下,这些网址所返回的是相同的文件,也就是网站首页,但是从技术上说,主机完全可以对这几个网址返回不同的内容。
除了上面因为带与不带www造成的,以及结尾是否带index.html文件名造成的不规范网址,网址规范化问题还可能由于如下原因出现:
●CMS系统原因,使同一篇文章(也可以是产品、帖子等)可以通过几种不同的URL访问。这种情况大量存在。
●URL静态化设置错误,同一篇文章有多个静态化URL。
●URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
●目录后带与不带斜杠。
http://www.domainname.com和http://www.domainname.com/是不同网址,但其实是一个页面。
●加密网址。
http://www.domainname.com和https://www.domainname.com同时存在,都可以访问。
●URL中有端口号。
http://www.domainname.com:80和http://www.domainname.com。
●跟踪代码。
有的联署计划或广告服务在URL后面加跟踪代码,如http://www.domainname.com/?affid=100和http://www.domainname.com/显示的都是首页内容。