Results for tag "nofollow"

noindex和nofollow标签有对于搜索引擎有什么区别

在网站建设初期的时候我们经常会在网站首页加上下面一段话来阻止搜索引擎蜘蛛的爬行,等网站基本完工的时候我们再去掉,这样就对于搜索引擎是比较友好的。”Nofollow”属性出现在网页级元标记中,用于指示搜索引擎不要追踪(即抓取)网页上的任何出站链接。例如:<meta name=”robots” content=”nofollow” />。

反向链接即外链是搜索引擎给网站排名的一个重要因素。为了添加反向链接,SEO作弊者会在论坛和博客等大量发布带无关链接的内容。这些垃圾链接的存在给搜 索引擎对网页质量的评估造成一定程度的麻烦,可以说nofollow是一个非常好的“垃圾链接防火墙”。正是百度、谷歌、Yahoo、MSN 为了应对垃圾链接(Spam)引入的一个属性,此属性目前应该被广泛采用。   Nofollow标签的作用有两方面,简单的说,一是不给链接投票,增加此链接的权重,二是使添加nofollow的部分内容不参与网站排名,便于集中网站权重。
SEOnofollow-300x207

至于noindex标签也似乎差不多作用,不过用法稍有不同,进入到需要屏蔽的网页代码里,在 <head> 部分加上下面一句即可

 <meta content="noindex">

这样搜索引擎会来到这个页面,但是当看到着这句时候就停止抓去了.而且该标签还有个有意思的地方就是对于已经被收录下来的网页添加这条代码后,当搜索引擎再次来爬行发现了新的命令就会将此页从搜索结果中完全丢弃 掉,即使已经有了高排名权重或者有大量外链指向该页,但是在搜索结果里也不会找到了,因此noindex标签 比nofollow来的似乎更强大

不过在搜索了一些案例和网友经历后发现,谷歌对noindex标签感觉很好,很灵敏。但是百度就有点让人捉摸不透了,百度搜索对于noindex标签似乎时收时弃的。

总之百度谷歌对nofollow标签一致认可,发现链接带nofollow就不会理睬其指向的页面,而noindex标签类似于自杀性质,不仅不让理还要求搜索引擎删除已经收录的页面,不过该标签的认可度不如前者

当 然由于资料搜集的不完整和缺乏试验推论,所以这俩个标签的细节之处还没有获得,但就目前知道的信息来说,在平时的优化过程中其实可以避免使用 noindex,对于不想被收录的网页直接在导入链接上用nofollow即可,当nofollow无法很好满足的时候,比如其他网站链接了本站一个不重 要页面,我们无法控制其他站得代码,那就给自己的网页加上noindex来实现拒绝搜索引擎的目的.

 

nofollow标签通常有两种使用方法:

1、将”nofollow”写在网页上的meta标签上,用来告诉搜索引擎不要抓取网页上的所有外部和包括内部链接。

<meta name=”robots” content=”nofollow” />

2、将”nofollow”放在超链接中,告诉搜索引擎不要抓取特定的链接。

<a rel=”external nofollow” href=”url”><span>内容</span></a>

在mete中,我们的nofollow还有另外的一些写法。

Meta robots标签必须放在<head>和</head>之间,格式:
<meta name=”robots” content=”index,follow” />
content中的值决定允许抓取的类型,必须同时包含两个值:是否允许索引(index)和是否跟踪链接(follow,也可以理解为是否允许沿着网页中的超级链接继续抓取)。共有4个参数可选,组成4个组合:
index,follow:允许抓取本页,允许跟踪链接。
index,nofollow:允许抓取本页,但禁止跟踪链接。
noindex,follow:禁止抓取本页,但允许跟踪链接。
noindex,nofllow:禁止抓取本页,同时禁止跟踪本页中的链接。

网站结构优化方案

1、优化网站结构目的

1)用户体验 用户访问一个网站必须能够不假思索地自如点击链接,找到自己想要的信息。这有赖于良好的导航系统,适时出现的内部链接,准确的锚文本。
2)收录 网站页面的收录在很大程度上依靠良好的网站结构。一个清晰的树形网站结构有利于搜索引擎蜘蛛顺利爬行。
3)权重分配 除了外部链接能给内部页面带来权重外,网站本身的结构及链接关系是内部页面权重分配的重要因素。哪些页面具备比较高的排名能力,取决于页面得到的权重。
4)锚文本 锚文本是排名算法很重要的一部分。网站内部链接锚文本是站长自己能控制的,所以是最主要的增加关键词相关性的方法之一。

2、搜索引擎友好的网站设计

1)搜索引擎蜘蛛能不能找到页面 A、要让搜索引擎发现网站首页,就必须要有外部链接连到首页,找到首页后,蜘蛛沿着内部链接找到更深的内容页,所以要求网站要有良好的结构,符合逻辑,并且所有页面可以通过可爬行的普通HTML链接达到。 B、JavaScript链接、Flash中的链接等搜索引擎蜘蛛一般不能跟踪爬行,就会造成收录问题。
2)找到网页后能不能抓取页面内容 被发现的URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、Session ID(一个终端用户与交互系统进行通信的时间间隔ID)、整个页面是Flash、框架结构、可疑的转向、大量复制内容等都可能使搜索引擎敬而远之。
3)抓取内容后怎样提炼有用信息 A、关键词在页面重要位置的合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等可以帮助搜索引擎理解页面内容,提取有用信息。 B、只有搜索引擎能顺利找到所有页面,抓取这些页面并提取出其中有相关性的内容,网站才可以被视为是搜索引擎友好的。

3、避免蜘蛛陷阱

有一些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。常见的如下这些。
Flash
Session ID
各种跳转
框架结构
动态URL
JavaScript链接
要求登录
强制使用Cookies

4、物理及连接结构

1)物理结构
网站物理结构指的是网站真实的目录及文件所在的位置所决定的结构。 一般来说比较合理的物理结构有两种。一种是扁平式的,也就是所有网页文件都存在网站根目录下:
http://www.deseui.com/index.html
http://www.deseui.com/pageA.html
第二种是树形结构,或称为金字塔结构。根目录之下以目录形式分成多个产品分类(或称频道、类别、目录、栏目等),然后在每一个分类下再放上属于这个分类的具体产品(或称为文章、帖子等)页面。
比如连衣裙分类为
http://www.deseui.com/lianyiqun/
分类下再放入具体的产品页面
http://www.deseui.com/lianyiqun/product-a.html
2)链接结构 网站结构的第二个意义指的是链接结构,或称为逻辑结构,也就是由网站内部链接形成的链接的网络图。对于搜索引擎来说更重要的是连接结构,而不是物理结构。 比较合理的链接结构是树形结构:
首页链接向所有分类页面
首页一般不直接链接向产品页,除了几个需要特殊推广的产品
所有分类首页连向其他分类首页
分类首页都链接回网站首页
分类首页链接向本分类下的产品页
分类首页一般不链接向其他分类的产品页
产品页都链接向首页,一般以网站导航形式体现
产品页链接向所有分类首页,一般以网站导航形式体现
产品页可以链接向同一个分类的其他产品页
产品页一般不链接向其他分类的产品页
在某些情况下,产品页可以用适当的关键词链接向其他分类的产品页

5、清晰导航

清晰的导航系统是网站设计的重要目标,对网站信息架构、用户体验影响重大。
1)站在用户角度,网站导航系统需要解决两个问题。
A、我现在在哪里?用户可能从任何一个内页进入网站,有时候从首页进入,点击多个连接后,用户也已经忘了是怎么来到当前页面的。导航系统这时就要清楚地告诉用户现在处在网站总体结构的哪一个部分。
B、下一步要去哪里?有时候用户知道自己想做什么,页面的导航设计要告诉用户点击哪里才能完成他的目标。
2)站在SEO的角度,网站导航系统应该注意一下几点。
A、导航文字 尽量使用最普通的HTML文字导航,不要使用图片作为导航链接,更不要使用JavaScript生成导航系统,也不要用Flash做导航。CSS可以设计出很好的视觉效果。最普通的文字链接对搜索引擎来说是阻力最小的爬行抓取通道。
B、点击距离及扁平化 良好导航的目标之一是使所有页面与首页点击距离越近越好。
C、锚文本包含关键词 导航系统中的链接通常是分类页面获得内部链接的最主要来源,数量巨大,其锚文本对目标页面相关性有相当大的影响,因此分类名称应尽量使用目标关键词。
D、面包屑导航 面包屑导航对用户和搜索引擎来说,是判断页面在网站整个结构中的位置的最好方法。
E、避免页脚堆积 近年来,搜索引擎比较反感页脚堆积富含关键词的分类页面链接的倾向。

6、子域名和目子域名和目子域名和目子域名和目录录录录 搜索引擎通常把子域名(或称为二级域名)当做一个基本独立的站点看待,也就是说
http://www.deseui.com

http://news.deseui.com 是两个互相独立的网站。
而目录 http://www.deseui.com/news/
就纯粹是http://www.deseui.com的一部分。
顺便介绍一下,www.deseui.com其实是deseui.com的一个子域名,只是约定俗成,网站一般以www.deseui.com为主URL。

7、禁止收录机制

有时候,站长并不希望某些页面被抓取和收录,如付费内容、还在测试阶段的页面、复制内容页面等。要确保页面不被收录,需要使用robots文件或Meta Robots标签。
搜索引擎蜘蛛访问网站时,会先查看网站根目录下有没有一个命名为robots.txt的纯文本文件,robots.txt用于指令搜索引擎禁止抓取网站某些内容或指定允许抓取某些内容。

8、nofollow的使用

Nofollow是2005年有Google领头新创的一个标签(严格说是属性),目前主流搜索引擎包括百度、雅虎、必应等都支持。
由于nofollow属性能阻止蜘蛛爬行和传递权重,因此很快被SEO用在某些内部链接,以达到控制内部链接权重和PR流动及分布的目的。

9、URL静态化

建议尽量要静态化URL的原因如下:
1)Google抓取任何动态网址没问题,并不意味百度、雅虎、必应、搜狗、搜索等都没有问题。
2)Google所说的静态化的弊端,基本上是基于静态化做得不正确的假设。问题是要静态化就得做正确,这样假设是没有道理的。
3)用户体验。静态化URL便于用户更清晰、更容易读懂,更可能被点击。

10、URL设计

1)URL越短越好 一方面为用户着想,便于增加点击率,另一方面短URL也利于传播和复制。
2)避免太多参数 参数太多用户看着眼花缭乱,也可能造成收录问题。
3)目录层次尽量少 这里指的是物理目录结构。
4)文件及目录名具描述性
5)URL中包含关键词 关键词出现在URL中,也能提高页面相关性,在排名时贡献一点分数。
6)字母全部小写 A、全部小写容易人工输入,不会因大小写掺杂而犯错。 B、有的服务器是区分大小写的,如Linux服务器,无论站长自己在做链接时还是用户输入时,因为大小写混用出现错误都会造成404错误。
7)连词符使用 目录或文件名中单词间一般建议使用短横线分隔,不要使用下画线或其他奇怪的字母。
8)目录形式还是文件形式 两种形式对排名没有多大的影响。

11、网址规范化

1)为什么出现不规范网址 下面几个URL一般指的是同一个文件:
http://www.deseui.com
http://deseui.com
http://www.deseui.com/index.html
http://deseui.com/index.html
但是从技术上来讲,这几个URL都是不同的网址,搜索引擎也确实把他们当做不同的网址。
除了以上,网址规范化问题还可能由于如下原因出现:
CMS(内容管理系统)原因,使同一篇文章(也可以是产品、帖子等)可以通过几种不同的URL访问。
URL静态化设置错误,同一篇文章中有多个静态化URL。
URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
加密网址
URL中有端口号
跟踪代码
显示的都是首页内容
2)网址规范化问题 网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦。 网址规范化造成几个问题:
CMS系统在不同地方链接到不同的URL,分散了页面权重,不利于排名。
外部链接也可能指向不同URL,分散权重。
搜索引擎判断的规范化网址不是站长想要的那个网址。
如果网址规范化问题太严重,也可能影响收录。
复制内容过多,搜索引擎可能认为有作弊嫌疑。
3)解决网址规范化问题 要解决URL规范化问题有很多方法,如确保使用的CMS系统只产生规范化网址,无论是否静态化。
所有内部链接保持统一,都指向规范化网址。
在Google管理工具中设置首选域。
使用301转向,把不规范化URL全部转向到规范化URL。
使用canonical标签。
提交给搜索引擎的XML网站地图中全部使用规范化网址。
4)301转向 301转向(或叫301重定向、301跳转)是用户或蜘蛛向网站服务器发出访问请求时,服务器返回的HTTP数据流中头信息部分状态码的一种,表示本网址永久性转移到另一个地址。
5)canonical标签 2009年2月,Google、雅虎、微软共同发布了一个新的标签canonical tag,用于解决网址规范化问题。

12、复制内容

复制内容也可以称为重复内容。复制内容指的是两个或多个URL内容相同,或非常相似。复制内容即可能发生在同一个网站内,也可能发生在不同网站中。
1)复制内容的害处
同一个网站内的复制内容会分散权重。
同站复制也造成收录过多没有意义的页面,在域名权重不高的情况下,可能挤占了其他独特内容的收录机会。
如果网站上存在大量复制内容,可能使搜索引擎对网站质量产生怀疑,导致惩罚。
2)消除复制内容
网址规范化,确保一篇文章只对应一个URL。
不是网址规范化造成的,选取一个版本允许收录,其他版本使用robots文件禁止收录。
使用canonical标签。
坚持原创,假以时日必定能够增加网站权重。

13、绝对路径和相对路径

绝对路径指的是包含域名的完整网址。相对路径指的是不包含域名的、被链接页面相对于当前页面的相对网址。
比如页面A的URL是:
http://www.deseui.com/pageA.html
页面B的URL是:
http://www.deseui.com/pageB.html
页面A链接到页面B时使用这种代码:
<a href=”../pageB.html”>
这就是相对路径。
在正确解析URL的前提下,绝对路径和相对路径本身对排名没有任何影响。

14、网站地图

通过网站地图,不仅用户可以对网站的所有内容一目了然,搜索引擎也可以跟踪链接爬行到网站所有主要部分。
1)HTML网站地图 HTML版本网站地图就是用户可以在网站上看到的、列出网站上所有主要页面链接的页面。
2)XML网站地图
XML网站地图是Google于2005年首次提出,2007年各主要搜索引擎都开始支持robots文件指定网站地图位置。现在百度也支持XML版本网站地图。
XML版本网站地图由XML标签组成,文件本身必须是utf8编码。网站地图文件实际上就是列出网站需要被收录的页面URL。
制作好网站地图文件后,可以有两种方式通知搜索引擎网站地图的位置,一是在站长工具后台提交网站地图文件。目前Google、雅虎、必应都已经开通站长工具,所有站长都可以注册。二是在robots.txt文件中通知搜索引擎网站地图文件位置,所有主流搜索引擎,包括百度、谷歌、雅虎、必应,都支持robots文件指定网站地图文件位置。

15、内部链接及权重分配

网站机构优化要解决的最重要的问题包括收录及页面权重分配。在理想情况下,经典树形结构应该是比较好的链接及权重分配模式。
1)重点内页 要想使这种重点内页获得高权重,最简单的方法就是在首页上直接加上几个重点内页的链接,甚至可以在侧栏推荐、促销部分加上全站链接。
2)非必要页面 在功能及用户体验方面很必要、但在SEO角度没必要的页面,如用户登录页面、用户注册页面、联系我们、关于我们等页面。为降低这些非必要页面的权重,一般可以采取几种方法。
A、只在首页显示链接,其他页面干脆取消链接。
B、使这些页面的链接不能被跟踪或传递权重,如使用Nofollow标签。
3)大二级分类 典型树形结构首页链接到一级分类,一级分类页面在列出二级分类,依此的结果是平均分配权重值,小分类页面充分收录,产品数量大的大分类有很多产品页面因为权重值稀释无法收录。解决这个问题,就是提高大二级分类页面的权重。
4)翻页过多 解决这个问题的最佳方式是再次分类。另一种方式是对翻页链接进行格式变化。如下图

5)单一入口还是多入口 大部分网站在结构方面面对的挑战,是使更多最终产品页面被收录。要让最终产品页面被收录,有两个策略:一是多入口,二是单一入口,在选择上需要慎重。 多入口指的是通向最终产品页面的链接路径有多条。这种结构的优势是为最终页面提供了多条爬行收录渠道。缺点是这些入口页面本身也占用网站收录页面名额,而且往往造成很多相似内容。
6)相关产品链接 相关产品链接要尽量随机,使本来不相连的页面能够交叉链接起来,为某些通过正常分类结构无法达到的区域提供入口。
7)锚文本分布及变化 合理的网站结构是在网站中分配锚文本的重要方法之一。在页面正文中或人工或自动加上其他页面的内部链接,链接锚文本可以有各种选择。
8)首页链接Nofollow
当页面上出现多个链接到同一个网址时,第一次出现的链接最重要,第一个链接的锚文本也最重要。如果页面上出现第一个首页链接是顶部logo,那么logo图片的ALT文字就相当于锚文本,需要放上首页的目标关键词。
9)给网站深层页面,尤其是具体产品页面建设一些外部链接,不仅有助于使外部链接构成趋向自然,也有助于页面收录。
10)分类隔离 最终产品页面只链接回自己的上级分类页面,不再链接到其他分类页面。这样,分类之间形成隔离,首页权重将会最大限度地“灌入”到最终产品页面,而不是浪费在分类页面上。

16、CMS系统

大部分CMS系统已经注意到搜索引擎友好问题。完美实现SEO效果的CMS系统,经常需要修改代码才能完成一些功能。从SEO角度出发CMS系统应该具备哪些基本功能呢?
1)页面标题客制化 CMS系统应该自动生成比较优化的页面标题,如分类页面采用:
分类名称-网站名称
产品页面使用:
产品名称-分类名称-网站名称 或 产品名称-网站名称
CMS系统还应该提供所有页面人工修改标题的客制化功能,在需要时站长可以根据关键词研究结果,重新撰写更恰当的标题。
2)URL静态化及客制化 URL静态化功能是必需的。通过CMS系统后台会有一个URL静态化选项,站长打开静态化功能,整个系统生成的页面就都使用静态化过的网址。 好的CMS系统还应该提供URL客制化功能,站长可以自己定义所有的目录名及文件名。
3)meta标签客制化 系统应该允许站长完全删除这两个标签,因为对搜索引擎排名几乎没有作用,如果不能生成恰当的标签,还不如不写。如果站长选择使用说明标签和关键词标签,应该可以选择生成格式或完全人工撰写。
4)正文撰写 提供编辑功能,用户可以在正文中加黑体、加图片、填写图片ALT文字、添加链接、选择链接锚文字等。
5)分类页面说明文字 分类页面也应该留出一个区域,让站长人工撰写最恰当的说明文字。
6)标签功能 站长发布产品或文章时可以输入标签,系统自动按标签聚合内容并生成标签页面。
7)消除复制内容 系统应该自动禁止抓取复制内容。
8)301转向 系统应该提供从任何一个页面做301转向到另外一个地址的功能,站长可以根据需要自由安排转向。
9)网站地图生成 好的CMS系统可以自动生成XML版本网站地图,站长只要向搜索引擎提交网站地图地址就可以了。
10)正确生成H标签 首页应该使用网站名称,或允许客制化H1标签中的内容。分类页面应该把分类名称放入H1标签,而不是网站名称。产品页面,则应该把产品名称放入H1标签。

17、404页面

用户访问网站上不存在的页面时,服务器通常应该返回404错误。
1)404错误代码 当页面不存在时,一定要确保正确返回404代码。
2)404页面设计 404页面要保持网站统一模板、设计风格、LOGO及名称,不要让用户弄不清自己到了哪个网站上。
404页面应该在最醒目的位置显示错误信息,明确提示用户,要访问的页面不存在。 错误信息下面还可以为用户提供几种点击选项,如网站地图,包括通往首页和重要分类页面的链接,建议用户可以访问的页面,还可以加上站内搜索框。
3)404错误与外链 与404有关的非常简单有效的外部链接技巧。出现外部链接连向不存在页面时,或者联系对方站长改正错误地址,或者将错误地址做301转向到正确页面,或者干脆在本来不存在的URL上建一个页面,接收这些外部链接的权重。