Post by account_disabled on Jan 29, 2024 8:37:45 GMT
作者的观点完全是他们自己的(不包括催眠这一不太可能发生的事件),并且可能并不总是反映 Moz 的观点。 Google 的索引覆盖率报告绝对非常棒,因为它可以让 SEO 更清晰地了解 Google 的抓取和索引决策。自推出以来,Go Fish Digital 几乎每天都使用它来为客户大规模诊断技术问题。 报告中提供了许多不同的“状态”,为网站管理员提供有关 Google 如何处理其网站内容的信息。虽然许多状态提供了有关 Google 抓取和索引决策的一些背景信息,但其中一个仍不清楚:“已抓取 - 目前未编制索引”。 自从看到“已爬网 - 目前未编入索引”状态报告后,我们收到了一些网站所有者的询问其含义。在代理机构工作的好处之一是能够获得大量数据,并且因为我们已经在多个帐户中看到了此消息,所以我们已经开始从报告的 URL 中了解趋势。 谷歌的定义 我们先从官方的定义开始。根据谷歌官方文档,该状态的意思是:“该页面已被谷歌抓取,但未编入索引。将来可能会或可能不会被索引;无需重新提交此网址进行抓取。” 所以,我们基本上知道的是: Google 能够访问该页面 Google 花费了一些时间来抓取该页面 抓取后,Google决定不将其纳入索引 理解这种状态的关键是想一想为什么谷歌会“有意识地”决定反对索引化。
我们知道 Google 在查找该页面时没有遇到问题,但由于某种原因,它认为用 目标电话号码或电话营销数据 户不会从查找该页面中受益。 这可能会非常令人沮丧,因为您可能不知道为什么您的内容没有被索引。下面我将详细介绍我们团队发现的一些最常见的原因,以解释为什么这种神秘状态可能会影响您的网站。 1. 误报 优先级:低 我们的第一步是始终对“已爬网 - 当前未编入索引”部分中标记的 URL 进行一些抽查以进行索引。发现被报告为已排除但最终出现在 Google 索引中的 URL 的情况并不少见。 例如,以下是我们网站报告中标记的 而,当使用站点搜索运算符时,我们可以看到该 URL 实际上包含在 Google 索引中。您可以通过在 URL 前附加文本“site:”来完成此操作。 站点搜索示例 如果您看到在此状态下报告的 URL,我建议首先使用站点搜索运算符来确定该 URL 是否已编入索引。有时,这些结果是误报。 解决方案:什么也不做!你很厉害。 2. RSS 源 URL 优先级:低 这是我们看到的最常见的例子之一。如果您的网站使用 RSS 提要,您可能会发现 Google 的“已抓取 — 目前未编入索引”报告中出现 URL。
很多时候,这些 URL 的末尾都会附加“/feed/”字符串。它们可以像这样出现在报告中: 已爬网中的 Feed URL 示例 - 当前未编入索引的报告 Google 发现这些 RSS 源 URL 从主页链接。它们通常会使用“rel=alternate”元素进行链接。WordPress 插件(例如 Yoast)可以自动生成这些 URL。 解决方案:什么也不做!你很厉害。 谷歌可能有选择地选择不对这些网址建立索引,这是有充分理由的。如果您导航到 RSS 源 URL,您将看到如下所示的 XML 文档: Feed URL XML 文档 虽然此 XML 文档对于 RSS 提要很有用,但 Google 无需将其包含在索引中。这会提供非常差的体验,因为内容不适合用户。 3. 分页 URL 优先级:低 “已爬网 - 目前未编入索引”排除的另一个极其常见的原因是分页。我们经常会看到此报告中出现大量分页 URL。在这里,我们可以看到一个非常大的电子商务网站中出现的一些分页 URL: 已爬网中的分页 URL 示例 - 当前未编入索引的报告 解决方案:什么也不做!你很厉害。 Google 需要抓取分页 URL 才能完整抓取网站。这是通向更深层次的类别页面或产品描述页面等内容的途径。然而,虽然 Google 使用分页作为访问内容的途径,但它不一定需要对分页 URL 本身进行索引。 如果有的话,请确保您没有做任何影响单个分页抓取的事情。
我们知道 Google 在查找该页面时没有遇到问题,但由于某种原因,它认为用 目标电话号码或电话营销数据 户不会从查找该页面中受益。 这可能会非常令人沮丧,因为您可能不知道为什么您的内容没有被索引。下面我将详细介绍我们团队发现的一些最常见的原因,以解释为什么这种神秘状态可能会影响您的网站。 1. 误报 优先级:低 我们的第一步是始终对“已爬网 - 当前未编入索引”部分中标记的 URL 进行一些抽查以进行索引。发现被报告为已排除但最终出现在 Google 索引中的 URL 的情况并不少见。 例如,以下是我们网站报告中标记的 而,当使用站点搜索运算符时,我们可以看到该 URL 实际上包含在 Google 索引中。您可以通过在 URL 前附加文本“site:”来完成此操作。 站点搜索示例 如果您看到在此状态下报告的 URL,我建议首先使用站点搜索运算符来确定该 URL 是否已编入索引。有时,这些结果是误报。 解决方案:什么也不做!你很厉害。 2. RSS 源 URL 优先级:低 这是我们看到的最常见的例子之一。如果您的网站使用 RSS 提要,您可能会发现 Google 的“已抓取 — 目前未编入索引”报告中出现 URL。
很多时候,这些 URL 的末尾都会附加“/feed/”字符串。它们可以像这样出现在报告中: 已爬网中的 Feed URL 示例 - 当前未编入索引的报告 Google 发现这些 RSS 源 URL 从主页链接。它们通常会使用“rel=alternate”元素进行链接。WordPress 插件(例如 Yoast)可以自动生成这些 URL。 解决方案:什么也不做!你很厉害。 谷歌可能有选择地选择不对这些网址建立索引,这是有充分理由的。如果您导航到 RSS 源 URL,您将看到如下所示的 XML 文档: Feed URL XML 文档 虽然此 XML 文档对于 RSS 提要很有用,但 Google 无需将其包含在索引中。这会提供非常差的体验,因为内容不适合用户。 3. 分页 URL 优先级:低 “已爬网 - 目前未编入索引”排除的另一个极其常见的原因是分页。我们经常会看到此报告中出现大量分页 URL。在这里,我们可以看到一个非常大的电子商务网站中出现的一些分页 URL: 已爬网中的分页 URL 示例 - 当前未编入索引的报告 解决方案:什么也不做!你很厉害。 Google 需要抓取分页 URL 才能完整抓取网站。这是通向更深层次的类别页面或产品描述页面等内容的途径。然而,虽然 Google 使用分页作为访问内容的途径,但它不一定需要对分页 URL 本身进行索引。 如果有的话,请确保您没有做任何影响单个分页抓取的事情。