1.2 关键词
关键词可以粗略等同于网页的定位,通过关键词的设计,对网页进行定位,再传达定位信息给搜索引擎,吸引相关的搜索客户到达页面。
1.2.1 关键词的定义
关键词(Keywords)是SEO中最重要的一个词汇。关键词就是你希望能在搜索引擎的搜索结构中获得良好排名,给网站带来流量的同时能推广目标的词汇。比如,你的文章内容是对新款手机的介绍,则“手机”一词可能就是你的关键词。
关键词分为核心关键词和长尾关键词(Long-tail Keywords)。长尾关键词是相对于核心关键词的一个概念,是核心关键词的一个扩展。比如“手机”是核心关键词,那么“iPhone 6 plus手机”就是一个长尾关键词。长尾关键词可以按照很多维度进行扩展,扩展的目的是捕获更多的流量。
对于某些词汇来说,可能说法完全不一样,但也是关键词的范畴。比如“国庆节”是关键词,那么“十一黄金周”在某些程度上可以认定为相关的语义关键词,这里的语义关键字实际是基于机器智能学习自动识别的关键词。在机器识别方面,有很多不同的规则,其中一个重要的规则是依据词汇之间经常同时出现的概率计算。
在关键词优化的时候,页面应该怎么部署关键词,关键词应该出现多少次?可以用关键词密度这个概念进行量化。业界对于关键词密度的公认数值为3%~8%,密度过低,排名不好,密度过高,有作弊之嫌,很容易被搜索引擎封杀。
那么,关键词密度是怎么定义的呢?
1.2.2 关键词密度
关键词密度是关键词在网页中所占比重的一种计量方式,对SEO的效果有重大影响。那么,关键词密度是怎么计算的呢?
例如,SEO是一门技术。
那么SEO的密度是多少呢?如果是网站工具,在考虑分词的情况下,实际的关键词密度计算方法如下。
分词:SEO,是,一门,技术。共4个词。
SEO出现1次,则密度=1/4=25%。
每个搜索引擎都有一套自己的分词方法,分词方法的优劣决定了搜索结果的精度。在分词的处理上,其普遍会建立一个词库,用来识别常见的词汇组合。比如“男人婆”是一个俗称,组合在一起的意思大家都很清楚,但是,搜索引擎是机器,不知道这个词的意思,很可能会将其切分成“男人”和“婆”两个字,这样,词汇原有的含义就丢失了。为了避免这种情况的发生,搜索引擎建立了一个专门的库,标识“男人婆”是一个专门的词汇,在遇到这个词的时候,不把它们切分开来。
建库是一个庞大的工作,一般通过机器学习的方式来完成。机器学习的基本原理是通过对海量网页进行分析,找到经常一起出现的词汇,把这些词汇提取出来,默认这些词是有专门意义的组合词,再通过逐步提取的方式,把基础库建立起来。
即使如此,再好的分词方法也有出错的可能,这时候就需要人工来标识辅助,逐步完善分词基本库的工作。几乎每个搜索引擎公司都有这种人工标识词库的人员,他们的工作就是不断地找出Bad Case(SEO专业术语,即坏案例),逐步优化词汇。
1.2.3 关键词的关键应用:锚文本
定义关键词以后,如何使用关键词是SEO最重要的工作。关键词的一个核心应用是锚文本(Anchor Text),锚文本为带链接的关键字,比如“百度”这个关键词设置超链接指向www.baidu.com,我们认为“百度”这个词就是一个锚文本。
锚文本起到的作用可以通俗理解为告知。比如我们设置了一个关键词“洗面奶”,然后该关键词设置了链接指向http://www.abc.com/ximiannai.html(此网址为例子,并不真实存在),我们就是在告诉搜索引擎,http://www.abc.com/ximiannai.html这个链接对应的页面内容主要是和洗面奶相关的。如果在互联网中,很多地方都出现“洗面奶”这个词汇指向http://www.abc.com/ximiannai.html,搜索引擎就会认为http://www.abc.com/ximiannai.html页面就是和洗面奶相关的,那么在搜索结果的排序上,如果客户搜索“洗面奶”,http://www.abc.com/ximiannai.html这个页面就会获得更好的排名,即在排序算法中,具有锚文本支撑的关键词会获得更好的排名。
具有锚文本支撑的关键词获得更好的排名可以类比生活中的例子,比如很多人都认为张××是个热心人,那么张××获得“热心人”的印象就会更加深入。
从锚文本的设置上看,锚文本分为站内锚文本和站外锚文本。站内锚文本即一个网站内某一个页面内设置的锚文本,链接指向是同一个网站内的另一个页面。比如虚拟页面http://www.abc.com/1.html有个锚文本指向虚拟页面http://www.abc.com/2.html,这就是一个站内锚文本,因为锚文本设置的页面和锚文本指向的页面都属于http://www.abc.com这个网站。站外锚文本即网站外某一个页面内设置的锚文本,链接指向本网站内某一个页面。比如虚拟页面http://www.abc.com/1.html有个锚文本指向虚拟页面http://www.efg.com/2.html,这就是一个站外锚文本,因为锚文本设置的页面和锚文本指向的页面分别属于http://www.abc.com和http://www.efg.com两个网站。
1.2.4 关键词排名
关键词排名实际是关键词所在页面的排序,也就是人们搜索一个关键词的时候,SEO所努力优化的网页在搜索结果中获得的排序。网页如果排在前面,获得点击的概率就会大大提升,反之,如果搜索结果排在后面,甚至没有排名,那么SEO工作就未见成效。努力让网页在搜索结果中获得更好的排名是SEO工作的重中之重。
考虑关键词对应页面的排名,主要针对几个大的搜索引擎,比如百度、谷歌、搜狗、360等。
每个搜索引擎都有一套关于搜索结果排序的算法,这个算法对搜索引擎公司来说是核心竞争力,因此我们不可能拿到每个搜索引擎公司的排序算法结果。但是,从公开的结果中,我们可以获得一些参考的资料。谷歌曾经发布过它的一套排序算法,从实际来看,这套发布的算法可能已经有了很大的改动,但是,并不妨碍我们依据发布的算法来推测搜索引擎在排序的时候更看重什么。
1.2.5 谷歌网页排名算法
谷歌发布的网页排名算法公式如下。
谷歌得分=(关键词得分×0.3)+(域名权重×0.25)+(外链得分× 0.25)+(用户数据权重×0.1)+(内容质量得分×0.1)+(人工提分)-(人工/自动降分)。
下面是对该公式的详细分析。
关键词得分包括如下。
● 网页Title。
● Hx(H1~H6)。
● 文本内容。
● 外链中。
● 域名/网址。
域名权重包括如下。
● 注册历史。
● 域名年龄。
● 外链权重。
● 外链、给出链接相关度。
● 使用历史、链接形式。
外链得分包括如下。
● 链接时间。
● 链接余名权重。
● 锚文本。
● 链接数量和权重。
● 外链页面主题。
用户数据权重如下。
● 搜索引擎结果页面(SERPs)的点击率。
● 用户在网页上停留的时间。
● 域名或统一资源定位符(URL)搜索量。
● 访问量及其他谷歌可以监测到的数据,如工具条、谷歌分析(GA)等。
内容质量得分包括如下。
● 流行的内容/关键词人工加分。
● 谷歌投票人员。
从谷歌之前公开的公式来看,排名和几个重要的因素相关:关键词、外链、域名、用户、内容等,其中关键词、外链和内容是SEO的核心。网上盛传的SEO公式,具有一定的参考意义,该公式如下。
SEO=∫Clock=∫C1+L2+K3+O4。
公式里面的参数解释如下。
(1)∫是一个积分符号,C=content(内容),L=link(链接),K=keywords (关键词),O=others(其他),Clock表示时间,即SEO就是一个长期的对“时间”的积分过程,因此,SEO不是一项急功近利的工作,希望能在1~2天就把一个关键词对应网页排到搜索引擎首页是不太可能的一件事情。
(2)C1:丰富的内容是第一位的要素,按照原创、伪原创、转载依次排列内容的重要性来满足用户体验,即不断增加网站的内容,提供更好的用户体验,是SEO成功至关重要的一环。
(3)L2:链接的合理与丰富是第二位的要素,即合理有效的内部链接与丰富的外部链接同等重要,而外部链接中高度相关、高PR值的页面尤为重要。
(4)K3:关键词因素是第三位的要素,包括合理的标题、描述、页面关键词及相关关键词的密度与合理布局。一般认为,2%~8%的密度较为合理。
(5)O4:其他因素,比如域名、站龄、服务器、网站架构、排版、邻居、URL、地图等。
这个公式将SEO概括性地阐述出来,把SEO需要注意到的要素都考虑进去了。根据这个公式,可以发现很多有价值的概念,有兴趣的朋友可以仔细品味。
1.2.6 百度网页排名算法
对于中文网站来说,在百度获得好的排名就是SEO工作成功的关键。百度的排序算法异常复杂,但是依据公开的文档,大致可以归类影响网页排序的几个重要因素。
1.页面相关性
页面相关性即用户检索的词和网页内容的匹配程度,比如用户搜索“睡眠面膜”,那么排在前面的页面应该都是和睡眠面膜相关的页面,即搜索到的结果应该是和关键词密切相关的,越相关的页面,在排序方面越会获得更高的加分。如何评价一个页面是否和搜索词汇相关,从算法上来说,有几个重要的指标。
● 关键词密度,即当前该关键词在页面文字分词结果中的比例。
● 关键词是否出现在重要的位置,如果关键词出现在页面的标题、Meta(元素可提供相关页面的元信息)、H1~H6等位置,就认为越重要,越相关。
● 关键词是否获得外部和内部的投票,比如站内、站外锚文本支持等,获得的投票越多,就会越相关。
2.权威性
主要含义如下。
● 权威性包括网站域名是否为政府专用的.gov类,网站的所属权是否为权威的公司或者部门。
● 是否普遍受欢迎,包括网站的点击率,即用户在所有搜索结果里面点击打开这个页面的比例;用户在网页的访问特性,比如网页访问时间、跳出时间等。正常来说,搜索引擎很难获取到网站的用户行为数据,但是,目前大部分的网站依赖搜索引擎的网站统计来做流量统计和用户行为分析,因此,搜索引擎以这些数据作为参考就很容易了。比如很多网站站长选择使用百度统计进行网站统计和分析,那么,百度通过借鉴百度统计的用户行为数据进行排序也不是一件很困难的事情了。
3.时效性
网页内容如果与信息相关,那么内容的时效性也是一个排序的依据,因为从用户角度来说,也是希望看到最新鲜的内容。但是时效性和检索词的关系很大,不能全部套用。信息相关的网页一般包括如下。
● 新闻网站,各种门户网站的新闻网页,比如新浪新闻、搜狐新闻、网页新闻等。
● 即时信息互动网站,比如微博类网站。在搜索引擎显示微博结果的时候,总是优先展现最新的信息,甚至直接按照时间进行倒排序。
4.准确性
页面内容是否能够满足用户检索的需求,甚至满足用户的延伸需求等。满足用户的检索需求即用户打开搜索结果页,里面的内容正是用户需要的。而延伸用户的检索需求,比如用户搜索“SPF15 防晒指数”,搜索结果页打开一看,是一个关于SPF15防晒指数的介绍页面,那么页面就具有相关性。如果该页面还有一些很实用的内容,比如SPF15和SPF30的效果相差有多大,SPF的指数是如何定义的,对于用户了解SPF来说,就非常有帮助,这类内容就属于满足用户的延伸需求的内容。
搜索引擎在对搜索结果进行排序的时候,会考虑以上重要的方面,但是整体来看,相关性是第一位的。因此,在对网站进行SEO优化时,一定不能脱离相关性这个基础。在实际网站运营中,很多门户网站会采用投机取巧的方法,利用热词来形成很多文章。比如家居类的网站,每天的新闻中会使用热词做标题,甚至以一些热点事件作为标题,但是文章的主题内容和热词没有任何关系。从短期来看,因为门户的权重比较大,这些文章的标题会吸引来大量关注热词或热点事件的访客,但是因为主题内容不相关,用户过来后会立刻离开,对用户和搜索引擎来说都是一种欺骗,这种行为注定不能持久,最终导致整个新闻或者信息频道,甚至是整个网站彻底被搜索引擎屏蔽。作为SEO人员,必须要意识到这种做法的风险性极高,避免自己做此类事情,也需要严格监督编辑人员不能做此类事情。
随着搜索算法的优化和互联网内容的丰富,以及网民的需求提升,为了能更加符合用户的搜索期望,搜索引擎目前逐渐把地域、业务领域、时效性等因素作为排名的参考依据,而不仅是参考网页的信息。
另外,地域因素在排序中逐渐加大了比例,即在对关键词排名的时候,会参考用户所在地的IP归属,尽量返回和用户目标一致的网页。比如一个用户在北京搜索“旅游”一词,会把“北京”这个地域当作参考因素,和关键词“旅游”放在一起作为参考,对网页进行过滤,因此,北京相关的旅游网页会获得更好的排名;如果在上海搜索“旅游”这个词汇,在返回的结果中,很多是上海相关的旅游网页,就不必奇怪了。
搜索引擎会通过机器学习等方法,对和地域有紧密联系的领域的词汇做专门管理,这类词汇如旅游、天气、交通、酒店、机票等。用户在搜索这些领域的词汇时,搜索引擎会把用户IP所在地域和关键词组合进行查询,返回更符合用户期望的信息。当然这里“地域”这个信息在组合条件中所在的权重,每个搜索引擎是不一样的,这也是不可公开的。在移动端搜索中,地理位置的信息可以通过Meta进行配置,通过定义省份、城市、经纬度的方式进行精准定位,关于移动端的精准定位可以参考本书移动搜索部分的内容。
时效性因素即用户查询某些领域的词汇时,返回最接近的网页数据。比如查询“奥斯卡”这个词汇,搜索引擎偏好显示最近的奥斯卡信息的网页。查询“奥运会”等信息,情况也是如此。
在判断时效性方面,可以基于不同的计算方法。比如通过获悉网页上的时间信息,或者通过分析前后页面的时间信息,来估算对应页面的时间信息。
个性化因素即用户查询词汇的时候,搜索引擎会依据用户的搜索习惯、喜好等,自动返回一些和客户喜好、习惯更相关的词汇。搜索引擎之所以能做到这一点,是因为每个客户在浏览网页的时候,会从客户端请求服务器,服务器会记录用户状态,并返回浏览器一小段文本信息,该小段文本信息就是Cookie(储存在用户本地终端上的数据)信息。主流的浏览器比如IE和Firefox等都支持Cookie的机制,即用户访问哪些网站和网页信息,实际在本地都做了记录。搜索引擎在进行结果推荐的时候,会调用Cookie的数据进行参考,判断用户的偏好,在此基础上,返回和用户偏好最相关的搜索结果,从而展现给客户的是更多个性化的内容。举个例子,某个SEO人员特别关注自己网站的某个关键词排名,可能在谷歌里天天搜索同一个关键词,然后点击自己的网站。可能有一天,当他再搜索这个关键词的时候,搜索引擎自动把他的网页放到了第一位。但是,另外一个SEO人员在同一个地区,搜索同一个关键词,上述网页的排名没有显示在前10位中,这就是Cookie记录的偏好结果的影响。目前,个性化因素已经在搜索引擎和众多商业领域中使用,都是在努力满足用户的偏好需求。
其外,小说、游戏、影视、品牌等领域的搜索引擎都开始逐步设立偏好标准。比如搜索一本小说,会尽量返回小说网站的页面,而搜索一部电视剧,会尽量返回视频网站的页面,这样做的好处是能缩短大部分用户的查询距离,使用户尽快点击搜索结果页,提升用户体验。
从SEO人员的角度来说,可以深入研究这些变化带来的影响,利用这些偏好来做更多的SEO工作。
1.2.7 关键词设置
关键词优化得好不好,关系到SEO工作的成败,其中,在页面很好地部署关键词成为SEO的重中之重。关键词部署有几个小诀窍。
● 保证页面的关键词密度为0.5%~3%,即页面需要出现关键词多次,但是控制在一定的程度,不能给人造成关键词堆砌的印象。
● 在关键词的几个重要区域出现关键词,并且关键词出现的位置尽量靠前,这几个位如下。
(1)Title(标题):关键字尽量靠前,在标题中尽量占据更大的比例。
(2)Keywords(关键词):使用关键词和长尾关键词。
(3)Description(描述):最好出现1~2次关键词和长尾关键词。
(4)页面导航:尽量出现关键词。
(5) H1~H6这些标题中巧妙融合关键词;网页正文里面第一次出现的关键词,可以加粗。
此外,在锚文本设置方面,尽量使用关键词或者长尾关键词作为锚文本的文字,这样能帮助提高关键词的排名。
可以这样说,关键词的出现、位置、密度、在锚文本中的使用,在一定程度上能决定关键词排名。
1.2.8 关键词管理
正因为关键词的优化成功与否关系到网站SEO的成败,如何完整、高效地管理关键词成为很重要的SEO工作。关键词的管理包括关键词+URL的管理和关键词+排名的管理。
关键词+URL的管理即不断优化关键词列表。关键词列表主要管理两个内容:关键词本身和目标页面URL。关键词和目标页面URL一一对应,为SEO的落地提供了切实可行的基础。URL可以理解为网络上每个文件的路径,我们打开一个网站页面,在浏览器地址栏看到的一长串字母就是一个URL,如http://www.abc.com/1.html。
关键词+URL的管理设计如表1-1所示。
表1-1 关键词和URL的关联表
随着网站业务的变化,关键词需要不断调整,已经不再关注的关键词需要从表格中删除,新增加的关键词需要补充到表格中。关键词对应的页面URL已经发生了变化的,需要单独更新页面URL。
关键词+排名的管理即定期更新关键词的排名信息,动态监控关键词的实际优化效果,为SEO工作的效果评估提供了切实的依据。
查看关键词的排名,最直接的办法就是在百度或者谷歌搜索这个词汇,然后手动翻阅查看并记录排名,如果目标页面排在搜索结果第一个,那么排名就是1;如果目标结果排名第二个,那么排名结果就是2;一般来说,针对单个搜索词,百度提供760个搜索结果,如果目标页面在这760个结果里面都没有找到,那么就可以认为是没有排名。手动查询+记录这个办法很耗体力,如果管理很多关键词,这是不现实的。
市场上帮助提供关键词排名查询的工具不少,只需要输入关键词,工具会自动帮助你查询在几个搜索引擎中的排名情况。这种工具的好处是能减少部分人力,但是,对于批量的关键词查询问题,还是没有解决。一些公司自己开展了批量查询的工作,但是经常被搜索引擎发现,被当作Spam(搜索引擎垃圾技术)查询而被封IP。
不管怎样,每一个关键词排名的变动,随时都牵动SEO的神经。因此,SEO需要周期性地查看关键词的排名情况,以此来定位工作重点并检验SEO方案的效果。
在查看排名情况的时候,经常需要查看在每个搜索引擎的最好排名和名次数据,如表1-2所示。
表1-2 关键词排名记录表
通过这些排名数据,可以看到SEO的实际效果,如果和竞争对手进行详细比较,就可以知道自己的弱点在哪里了。