数据驱动:GOOGLE SEO锚文本全讲解（研究了 384,614 个网页）

每个人都知道链接是一个至关重要的排名因素。但是链接锚文本呢？

以下是 Google 的 John Mueller所说的：

大多数链接确实通过它们的锚文本提供了一些额外的上下文。至少应该是吧‽

— ? John ? (@JohnMu) 2017 年 11 月 23 日

他似乎暗示谷歌使用锚文本来帮助理解链接的上下文，因此，它可能是一个“排名因素”。这并不奇怪——谷歌的原始专利声明他们使用锚文本来影响排名。（稍后会详细介绍！）

这是约翰的另一条推文，他重申了锚文本的重要性：

是的，但是锚文本（和图像替代文本）在理解上下文方面帮助了我们很多，所以如果你可以避免它，我不会忽略它。 — ? John ? (@JohnMu) 2017 年 5 月 15 日

问题是：你应该使用什么样的锚文本？如果您想在搜索引擎中排名，您是否应该限制使用特定类型的锚文本？你甚至应该操纵锚文本吗？在本指南中，我们将通过研究384,614 个网页的反向链接的锚文本来揭示我们的发现。但首先，让我们确保我们了解基础知识。

什么是锚文本？

锚文本是指用于将一个网页链接到另一个网页的可点击词。

示例：在这句话中，蓝色单词是锚文本。

锚文本的类型

假设有人决定链接到我们的反向链接检查器。我们该页面的主要目标关键字是“反向链接检查器”，根据Ahrefs 的关键字资源管理器，全球每月搜索量为 80K 。

通过Ahrefs 的关键字浏览器

但并不是每个人都会以同样的方式链接到这个页面。以下是他们可能使用的一些锚文本变体：

完全匹配：锚文本是我们想要排名的确切关键字或短语。

Ahrefs 的反向链接检查器是我最喜欢的 SEO 工具之一。

短语匹配：锚文本包含我们想要排名的关键字短语。

Ahrefs 的反向链接检查是我最喜欢的 SEO 工具之一。

部分匹配：锚文本包含查询中的所有单词，但不是精确的短语。

Ahrefs 的 Checker de la Backlink 是我最喜欢的 SEO 工具之一。

Branded：锚文本是我们品牌的名称：

Ahrefs的反向链接检查器是我最喜欢的 SEO 工具之一。

裸 URL：锚文本是原始的“裸” URL（即，它会出现在浏览器中）：

Ahrefs 的反向链接检查器 ( https://ahrefs.com/backlink-checker/ ) 是我最喜欢的 SEO 工具之一。

随机：锚文本是一个不特定的通用短语，不包含我们的目标关键字（例如，“单击此处”、“此站点”、“本文”等）

Ahrefs 的反向链接检查器是我最喜欢的 SEO 工具之一。单击此处亲自尝试！

图片链接：锚文本是图片的替代文本（根据谷歌）。

<a href=”https://ahrefs.com/backlink-checker”> <img src=”/backlink-checker.png” alt=”Backlink Checker”/> </a>

现在让我们看看锚文本如何影响我们的排名。

锚文本如何影响搜索引擎排名

谷歌使用外部锚文本来帮助理解你的页面是关于什么的，以及它应该对哪些关键词进行排名。我们怎么知道呢？以下是 Google 算法所基于的原始论文的摘录：

Google 采用了多种技术来提高搜索质量，包括页面排名、锚文本和邻近信息。

因此，如果我链接到这篇文章中以“dog biscuits”作为锚文本的页面，这将向 Google 表明链接的页面可能与 dog biscuits 有关。

如果其他人做同样的事情，那么这将增加谷歌的信心，即相关页面应该可能为“狗饼干”排名。毕竟，如果页面与狗饼干没有任何关系，那么两个或多个不相关的网站链接到具有相同锚文本的同一网页的可能性有多大？很少！希望您开始明白为什么锚文本作为排名因素是有意义的。但是，当然，搜索引擎优化中的任何事情都不是那么简单。

早期谷歌（过度）依赖锚文本

在 Google 的原始算法中，锚文本的权重很大。谷歌创始人谢尔盖·布林和拉里·佩奇在 1998 年的论文中解释说：

链接文本在我们的搜索引擎中以特殊方式处理。大多数搜索引擎将链接的文本与链接所在的页面相关联。此外，我们将其与链接指向的页面相关联。这有几个优点。首先，锚点通常比页面本身提供更准确的网页描述。

使用锚文本还允许 Google 确定无法使用典型页面信号的媒体格式主题。

其次，锚点可能存在于无法被基于文本的搜索引擎索引的文档中，例如图像、程序和数据库。这使得返回实际上未被抓取的网页成为可能。

逻辑是合理的，结果令人印象深刻，尤其是与当时的竞争对手相比——创始人自己并没有忽视这一事实。

虽然完整的用户评估超出了本文的范围，但我们自己使用 Google 的经验表明，对于大多数搜索而言，它比主要的商业搜索引擎产生更好的结果。

但谷歌很快发现锚文本很容易被操纵。要对查询的网页进行排名，人们只需将多个链接指向它，并将目标关键字作为锚点。

比您的竞争对手更多的关键字丰富的锚文本链接 = WIN。

这导致了一些有趣的“谷歌轰炸”例子——搜索引擎优化通过将锚文本链接指向不相关的页面并对其进行排名。

显然，事情必须改变。

谷歌反击操纵锚文本

2012 年 4 月，谷歌推出了他们现在臭名昭著的企鹅算法的第一次迭代。锚文本是 Penguin 的主要目标之一。一些使用完全匹配的锚文本链接过于激进的网站在一夜之间看到他们的排名下降。然而，据谷歌称，它只影响了 3.1% 的搜索查询。但事情并没有就此停止……

谷歌通过后续企鹅更新继续与操纵性锚文本垃圾邮件作斗争。大多数 SEO 现在似乎建议谨慎使用完全匹配的锚文本——通常在 1% 到 5% 之间。

来自另一个 SEO 博客的推荐完全匹配锚文本 % 示例。

那么真相是什么？您是否应该将精确匹配的锚点保持在最低限度？你应该完全避免完全匹配的锚文本吗？短语匹配和其他类型的锚锚文本怎么样——你应该如何使用它们？为了找出答案，我们进行了两项研究。

研究 1：锚文本对 19,840 个关键词的影响

为了研究锚文本类型和排名之间的相关性，我们查看了 19,840 个关键字的前 20 个搜索结果。这意味着我们总共分析了 384,614 个网页！

边注：

你们中的一些人可能已经注意到 19,840 * 20 != 384,614，而是 396,800。这是因为一些 URL 的排名不止一个我们研究的关键词。

所有这些关键字：

每月有 2K-5K 次搜索（随机选择！）；
由2-4个英文单词组成；
不包含特殊字符（例如，!#@）；
非数字（即，电话号码等关键字被过滤掉）

此外，我们只选择了前 10 个搜索结果具有相似URL 评级 (UR) 值的关键字。这样做的目的是“隔离”锚文本变量。让我用一个粗略的例子来解释。

假设“最佳蛋白粉”的前 10 个搜索结果如下所示：

精确锚匹配%：100%。你的分数：60
精确锚匹配%：90%。你的分数：55
精确锚匹配%：80%。你的分数：50
精确锚匹配%：70%。你的分数：45
精确锚匹配%：60%。你的分数：40
精确锚匹配%：50%。你的分数：35
精确锚匹配%：40%。你的分数：30
精确锚匹配%：30%。你的分数：25
精确锚匹配%：20%。你的分数：20
精确锚匹配%：10%。你的分数：15

您可以看到完全匹配锚文本的百分比与排名相关。由此，我们可以推断出完全匹配率会影响排名。但是，这是具有误导性的，因为 UR 也存在相关性。因此，反向链接（或内部链接）的数量和质量很可能也是这种相关性的部分原因。

另一方面，如果结果看起来像这样……

精确锚匹配%：100%。你的分数：30
精确锚匹配%：90%。你的分数：25
精确锚匹配%：80%。你的分数：32
精确锚匹配%：70%。你的分数：33
精确锚匹配%：60%。你的分数：28
精确锚匹配%：50%。你的分数：31
精确锚匹配%：40%。你的分数：31
精确锚匹配%：30%。你的分数：27
精确锚匹配%：20%。你的分数：36
精确锚匹配%：10%。你的分数：29

......那么由反向链接（或内部链接）引起的任何潜在相关性的可能性要低得多。让我们来看看结果。

精确匹配锚文本的影响

首先，我们查看了每个排名位置的精确匹配锚文本反向链接的平均百分比和中值百分比——根据指向 URL 的反向链接总数计算。

所以看起来这里有一个非常明显的相关性，对吧？不一定。

显示相关性的蓝线是平均值。这是属于每个位置的点的“有偏差”表示，因为极值很容易使平均值偏斜。

假设我们有以下位置 #1 的页面示例：

第 1 页： 0% 完全匹配的锚；
第 2 页： 0% 完全匹配的锚；
第 3 页： 0% 完全匹配的锚；
第 4 页： 0% 完全匹配的锚；
第 5 页： 100% 完全匹配的锚点；

此样本的平均精确匹配锚文本 = 20%。

您可以看到，这并不能很好地代表整个样本——一个值使平均值发生了相当大的偏差。这就是为什么我们还将中值添加到图表（橙色线）中。您可以看到每个排名位置的中位数为零。

以下是我们的数据科学家Loveme Felicilda对此的评价：

我会说平均值不是表示相关性的好方法。这就是为什么我也显示中位数。所有位置的中位数为零的事实意味着有很多页面没有完全匹配的反向链接。如果我们的中值与我们的平均值显示相同的“模式”，那么我们就会有很强的相关性。因此，如果我们想要呈现相关性，那么我们应该在图表上绘制所有点并添加一条最佳拟合线。

洛夫梅·费利希尔达， Data Scientist Ahrefs

就是这样：

现在您可以看到真正的相关性非常弱。为了补充这一点，下面是相关性的直方图。x 轴显示分桶相关值，y 轴显示属于每个桶的 SERP/关键字的数量。

一般来说，图形越钟形和对称，相关性越接近中间值（在这种情况下，即为零）。如果它向右倾斜，则更正相关。如果它向左倾斜，那么它是负相关的。您可以看到，在这种情况下，它略微向右倾斜——这表明正相关性较弱。弱到什么程度？以下是Spearman 相关性的结果：

斯皮尔曼相关性（平均）： 0.1436
斯皮尔曼相关性（中位数）： 0.1869

结果：完全匹配锚文本链接的百分比和排名之间的相关性相对较弱。均值和中位数都表明了这一点。

边注：

我们包括了 Spearman 相关性的中值，因为某些利基（例如，发薪日贷款）的锚文本非常重，并且可能扭曲了平均值。

但这是为什么呢？如果谷歌使用锚文本作为排名因素——或者至少是为了理解页面的上下文，正如约翰·穆勒所说——那么不应该有更大的相关性吗？不是的。John 从未说过他们在算法中赋予锚文本多少权重。

此外，我们的数据中存在一个潜在的、有些不可避免的缺陷，一会儿聊这个问题。首先，让我们看一下其他锚文本类型的数字……

短语匹配锚文本的影响

回顾一下，短语匹配锚文本是那些包含目标查询的锚文本。例如，如果关键字是“SEO 工具”，那么“最佳 SEO 工具”或“我最喜欢的 SEO 工具”都将是短语匹配锚文本。让我们看看这些是如何统计的。

这里有两点突出：

平均值的“相关性”类似于精确匹配。
短语匹配锚文本的平均百分比略高于精确匹配。

但同样，为了看到“真实”的相关性，我们需要查看一些不同的图表：

所以这一次，相关性甚至低于精确匹配的锚文本。

斯皮尔曼相关性（平均）： 0.1057
斯皮尔曼相关性（中位数）： 0.1393

结果：短语匹配锚文本的百分比与排名之间的相关性非常弱。

部分匹配锚的影响

部分匹配锚文本是那些包含查询中所有单词但不是精确短语的锚文本。例如，如果关键字是“SEO 工具”，那么“SEO 的最佳工具”或“我最喜欢的 SEO 技巧是使用 Ahrefs 的这个工具”都将是词组匹配锚。让我们看看这些是如何统计的。

就平均值而言，似乎再次存在类似的相关性，并且中值仍然趋于零。此外，与完全匹配和词组匹配百分比相比，部分匹配关键字的平均百分比相当高。这是有道理的，因为部分匹配包含完全匹配和词组匹配关键字。

以下是显示相关性更好表示的两个图表：

这里的相关性几乎与短语匹配相关性相同：

斯皮尔曼相关性（平均）： 0.1076
斯皮尔曼相关性（中位数）： 0.1393

结果：相关性非常弱。

随机锚文本的影响

随机锚文本是那些包含非特定或通用短语的锚文本。它们不包含目标关键字（或它的任何元素）。如果关键字是“SEO 工具”，那么“点击这里”或“这篇文章”都将是随机锚点。让我们看看这些是如何统计的。

您会注意到的第一件事是，与我们研究的其他类型的锚文本相比，随机锚文本的平均百分比非常高。这是有道理的，因为除了一些非常特定的锚之外，随机锚文本几乎包含了所有其他锚文本。您还会注意到，平均值似乎表明排名和随机锚文本百分比之间存在某种相关性（尽管很弱）。

我认为这是为什么看平均值是一个坏主意的最好例子。让我们看一些更可靠的图表来判断真实的相关性。

您可以看到直方图似乎既不向左也不向右倾斜。这意味着相关性趋向于中间值，即零。以下是 Spearman 相关性：

斯皮尔曼相关性（平均）： 0.0161
斯皮尔曼相关性（中位数）： 0.0130

结果：实际上没有相关性。那一点也不奇怪。

研究 2：跨 16,000 个页面的周围链接文本影响

如果您熟悉Ahrefs Site Explorer中的反向链接报告，那么您就会知道我们会显示链接的锚文本和周围的链接文本。

为什么这是相关的？2004 年，谷歌提交了一项名为“基于参考上下文的排名”的专利。这是该专利的有趣摘录：

[…] 链接周围的数据、链接左侧或链接右侧的数据或与链接关联的锚文本可用于确定与链接关联的上下文。

换句话说，如果实际的锚文本碰巧是随机的并且与链接页面无关，Google 可能会查看周围的链接文本以帮助了解该页面的内容。您可以通过上面屏幕截图中描述的示例看到它是如何工作的。锚文本是随机的/通用的，但周围的链接文本提供了一些上下文。考虑到这一点，我们认为研究排名与关键字在周围链接文本中的出现之间是否存在任何相关性会很有趣。

所以这就是我们所做的：

我们从研究#1 中采用了相同的关键字集，但只包括带有随机锚文本的页面——即没有任何精确/短语/部分/等的页面锚文本链接。这给我们留下了 27,156 个网页。

为了最大限度地减少偏差，我们进一步将样本减少到 16K 页——每个位置 (1-20) 为 800 页。这是为了确保任何相关性都基于每个排名位置的相同页数。让我们来看看我们发现了什么。

精确匹配关键字对周围链接文本的影响

假设我们的目标关键字是“SEO 工具”。以下是在周围链接文本中使用完全匹配关键字的链接示例：

Ahrefs 的反向链接检查器是我最喜欢的 SEO 工具。

现在让我们看看结果。

您可以看到这里几乎没有相关性。

斯皮尔曼相关性（平均）： 0.0640

结果：在周围的链接文本中包含完全匹配的关键字似乎对排名没有显着影响。

部分匹配关键字对周围链接文本的影响

这次我们来看看目标关键字中所有术语的出现与排名之间的相关性——即部分匹配。例如，如果我们的关键字是“SEO工具”：

Ahrefs 的反向链接检查器是我最喜欢的营销工具。

结果如下：

斯皮尔曼相关性（平均）： 0.0205

结果：排名与来自查询的所有单词在周围链接文本中的出现之间几乎为零相关。

来自目标查询的 1+ 个词对周围链接文本的影响

最后，我们研究了排名与目标查询中至少一个术语在周围链接文本中的出现之间的相关性。例如，如果我们的关键字是“SEO 工具”：

Ahrefs 的反向链接检查器是我最喜欢的营销工具。

Ahrefs 的反向链接检查器是我最喜欢的检查 SEO 反向链接的方法。

Ahrefs 的反向链接检查器是我最喜欢的 SEO 工具。

您可以看到这也包含了精确匹配、短语匹配和部分匹配。结果如下：

有趣的是，目标查询中至少有一个词的链接在周围链接文本中的平均百分比相当高——所有排名位置的平均百分比为 20-25%。尽管如此，重要的是要注意中位数为零，这意味着我们研究的大多数页面都没有与周围文本中目标查询中的一个或多个单词的链接。至于与排名的相关性：

Spearman 相关性（平均）：- 0.0701

结果：轻微的负相关，但它非常接近于零，以至于实际上没有相关性。

为什么这两项研究都存在潜在缺陷

没有研究是完美的，我们的也不例外。让我解释一下为什么。假设我们想知道我们的电子邮件地址查找指南中有多少具有完全匹配锚文本的反向链接。这听起来很容易……直到您考虑到帖子为 7K+ 关键字排名的事实！

那么我们应该研究这 7,205 个关键字中的哪一个作为我们的完全匹配词组？

我知道你在想什么：这里的主要目标关键字显然是“查找电子邮件地址”，所以我们当然应该研究以该短语作为锚文本的反向链接的数量，对吧？

这是一个有点合乎逻辑的假设，但有两个问题：首先，虽然我们可以很容易地为这个页面做到这一点，因为我们知道主要目标关键字，但我们应该如何大规模地为 384,614 个网页做同样的事情？我们不能，也没有，因为无法确定这些页面所针对的主要关键字。

----------------------

速记

在Ahrefs 关键字资源管理器中，我们在SERP 概览中显示目标关键字排名前 10 的页面，以及包括“热门关键字”在内的一系列 SEO 指标。

“热门关键字”是占该页面自然流量最多的关键字。那么，为什么不使用这个指标来克服我们锚文本研究的第一个问题呢？

答：因为“热门关键字”只显示哪个关键字恰好为页面发送了最多的自然流量，而这并不总是作者打算排名的关键字。另外，我认为可以公平地说，许多锚文本链接，尤其是精确匹配的链接，是“链接操纵”的结果——即 SEO 以目标关键字作为锚点建立链接，目的是提高该页面的排名所述关键字的搜索引擎。把这两件事放在一起，你就会明白为什么使用“Top 关键字”不能解决我们的问题。

----------------------

其次，我们的 384,614 个网页样本来自查看 19,840 个关键字的前 20 个排名页面。然而，所有这些关键词都符合一组初始标准，其中一个是每月搜索量在 2,000 到 5,000 之间。仅凭该标准肯定会排除某些页面的主要目标关键字。事实上，“查找电子邮件地址”就是这种情况，它在美国的月搜索量为 5,500。

现在，在您假设我用来说明这一点的页面是异常值并且大多数页面没有针对这么多关键字进行排名之前，请先看一下：

我们研究了 300 万个随机搜索查询，发现平均而言，排名前 10 的页面也排名在 400 到 1,300 个其他查询之间。因此，很明显，这是我们的研究没有考虑到的大规模事件。这让我巧妙地来到了你们可能一直在等待的部分……

你应该在 2022 年建立与特定锚文本的链接吗？

假设有一些神奇的方法可以知道我们研究的每个页面的主要目标关键字，这会改变什么吗？这是不可能的，但这是正确的问题吗？我不相信它是，我不相信以建立关键字丰富的锚文本为目标是 2022年的好策略。以下三个原因：

1) 主题 > 关键词

这是一个有趣的事实：

平均而言，在Ahrefs 博客上的所有帖子中，只有 22% (~⅕) 的流量来自主要目标关键字。

因此，即使我们的研究没有缺陷，并且我们发现使用精确匹配的锚文本，比如说，13% 的时间是为您的目标关键字排名的秘诀（这不是，只是为了清楚），然后从逻辑上讲，专注于构建关键字丰富的链接仍然不应该是您的重点。

那是因为将精力集中在提高单个关键字的排名显然是一种疏忽——它只负责发送该页面总流量的一小部分。但为什么会这样呢？为什么我们的网页——以及其他人的网页——看不到来自主要目标关键字的更高百分比的总流量？

让我解释…

谷歌对自然语言查询的理解可以说比以往任何时候都要好。部分原因在于 2013 年Hummingbird的推出，根据Wikipedia的说法，它“更加强调自然语言查询，考虑上下文和含义而不是单个关键字” 。正因为如此，为其目标关键字排名的页面也倾向于针对一堆长尾变体进行排名，这些变体结合起来通常会导致页面的绝大多数流量。

举一个例子，这是我们通过Ahrefs Site Explorer查找电子邮件指南的美国总自然流量：

这是来自目标关键字的自然流量：

1,076/ 6,200 =来自目标关键字的总流量的约 17%。

所以：

精确匹配锚文本只能定位一个关键字，而在 2019 年，一个关键字的排名不是 SEO 的全部内容，也不应该是您的主要目标。

话虽如此，你们中的一些人可能已经发现了这个论点中可能存在的缺陷。

它是这样的：

如果您可以通过构建以“ x” 作为锚文本的链接来说服 Google 的页面是关于 x的，并且 Hummingbird 将x 与y和z相关联，那么构建关键字丰富的链接并不会间接增加 Google 对您的页面服务的信心作为相关结果，不仅针对x，还针对y、z和任何其他相关查询，从而有可能全面提高排名和流量？

这可能是真的，但这肯定是实现这一结果的一种冒险且不必要的困难方式——尤其是在企鹅时代之后。做一些页面搜索引擎优化并优化与主题相关的关键字（即不仅x，而且 y 和z ）会容易得多。