meta robots标签的写法 – 阿波罗咨询

meta robots标签针对具体一个网页，设置比robots.txt文件更灵活，除了是否收录本页面外，还能控制搜索引擎蜘蛛是否跟踪本页面内的链接等。关于meta robots标签的写法，权威的解释是About the Robots <META> tag。content可以有四个值：”INDEX”, “NOINDEX”, “FOLLOW”, “NOFOLLOW”，可以单独，也可以组合，主要有四种组合：<meta name=”robots” content=”index,follow”><meta name=”robots” content=”noindex,follow”><meta name=”robots” content=”index,nofollow”><meta name=”robots” content=”noindex,nofollow”>index,follow：允许收录本页，允许跟踪链接。index,nofollow：允许收录本页，但禁止跟踪链接。noindex,follow：禁止收录本页，但允许跟踪链接。noindex,nofllow：禁止收录本页，同时禁止跟踪本页中的链接。如果网页没有robots元标签，默认等同于第一种。上述写法不区分大小写，建议一律小写。Ethan感到各大搜索引擎在使用meta robots上是有些差异的。百度在禁止搜索引擎收录的方法提及meta robots标签的写法，有以下的例子：如果您不想搜索引擎追踪此网页上的链接，且不传递链接的权重，请将此元标记置入网页的 <HEAD> 部分：<meta name=”robots” content=”nofollow”>要允许其他搜索引擎跟踪，但仅防止百度跟踪您网页的链接，请将此元标记置入网页的 <HEAD> 部分：<meta name=”Baiduspider” content=”nofollow”>要防止所有搜索引擎显示您网站的快照，请将此元标记置入网页的 <HEAD> 部分：<meta name=”robots” content=”noarchive”>要允许其他搜索引擎显示快照，但仅防止百度显示，请使用以下标记：<meta name=”Baiduspider” content=”noarchive”>注：此标记只是禁止百度显示该网页的快照，百度会继续为网页建索引，并在搜索结果中显示网页摘要。百度支持哪些Robots Meta标签？百度支持nofollow、noarchive两种种meta标签。可见百度支持noarchive，并且可以用Baiduspider代替robots仅针对百度。至于百度知否支持noindex，要打个问号，有人反映说百度会收录部分noindex的页面。区分一下noarchive和noindex，noindex是不收录，noarchive是正常收录，正常显示搜索结果（包括摘要），但如果点击快照，看不到网页缓存。有人故意为网页设置noarchive，目的是增加点击率，搜索引擎会记录这种点击率，点击率提高有利于该网页排名。google支持NOARCHIVE、NOSNIPPET、NOODP等，具体英文参见Using the robots meta tag（可能需要翻墙才能打开），中文参见元标记和使用元标记拦截对您网站的访问。可以用googlebot代替robots仅针对google。注意google在使用元标记拦截对您网站的访问中明确了noindex对于google的效果非常彻底，百度没有类似的表述：如果Google看到某一页上有noindex元标记，就会将此页从我们的搜索结果中完全丢弃，而不管是否还有其他页链接到此页。但是，其他搜索引擎可能会以不同的方式解译此指令。因此，指向相关网页的链接可能仍会显示在搜索结果中。最后Ethan要提醒大家，robots.txt文件的优先级比robots元标签要高，因为搜索引擎蜘蛛在抓取任何网页前，首先抓取robots.txt文件，如果一个网页被robots.txt屏蔽了，搜索引擎蜘蛛不会访问这个网页，robots元标签里放什么都没用。